README.md

git clone git@git.cs.usask.ca:qnm481/syntenylink.git
cd SyntenyLink
pip install -r requirements.txt
python3 main_script.py -i abc_synteny.success.colinear -g -m -n -gt abc_groundtruth.xlsx -c abc_synteny.all.chains -bl abc_blastn.blast
BraA01g000010.3C    AT1G43860.1 74.194  124 14  3   80  186 231 353 9.61e-56    188
$ makeblastdb -in ref_pep.fa -dbtype prot -out ref_pep

$ blastall -i query_pep.fasta -p blastp -d ref_pep -m 8 -e 1e-5 -F F -v 5 -b 5 -o abc.blast -a 4
$ ./SyntenyLink_bf.pl dir/abc.blast
BraA01g000010.3C    AT1G43860.1 74.194  124 14  3   80  186 231 353 9.61e-56    188
BraA01g000010.3C    AT3G04630.1 66.087  115 21  4   194 297 165 272 7.06e-33    125
BraA01g000010.3C    AT3G04630.3 66.087  115 21  4   194 297 164 271 7.88e-33    125
A1  BraA01g000010.3C    2944    3050    Chr1    AT1G43860.1 16622247    16622597    9.61E-56    188
A1  BraA01g000010.3C    3058    3161    Chr3    AT3G04630.1 1259234 1259503 7.06E-33    125
$ python3 dir/transform_blast_to_dagchainer.py dir/abc_blast_filtered_modified.txt dir/query.bed (or dir/query.gff3) dir/subject.bed (or dir/subject.gff3)
$ ./run_DAG_chainer.pl -i dir/transformed_blast_output_with_selected_columns.blast -s -I
## alignment A1 vs. Chr1 Alignment #1  score = 5177.6 (num aligned pairs: 121):
A1  BraA01g026830.3C    17161339    17161504    Chr1    AT1G56580.1 21198405    21198568    2.180000e-109   50
A1  BraA01g026890.3C    17191267    17191318    Chr1    AT1G57550.1 21312544    21312593    3.270000e-24    40
A1  BraA01g026900.3C    17196325    17196618    Chr1    AT1G57610.3 21337612    21337818    8.840000e-106   84
AT1G01010   AT1G01010.1 429 Chr1_1  Chr1    1   3631    5899    AT1G01010.1  NAC domain containing protein 1
AT1G01020   AT1G01020.1 245 Chr1_2  Chr1    2   5928    8737    AT1G01020.1  Arv1-like protein
AT1G01030   AT1G01030.1 358 Chr1_4  Chr1    4   11649   13714   AT1G01030.1  AP2/B3-like transcriptional factor family protein
$ perl SyntenyLink_st.pl -d abc_synteny.aligncoords -g ref_genelist.txt
BraA01g000010.3C    AT1G43860.1 74.194  124 14  3   80  186 231 353 9.61e-56    188
BraA01g000010.3C    AT3G04630.1 66.087  115 21  4   194 297 165 272 7.06e-33    125
BraA01g000010.3C    AT3G04630.3 66.087  115 21  4   194 297 164 271 7.88e-33    125
A6_Chr1_4   Chr1    AT1G14070   BraA06g010220.3C
A6_Chr1_4   Chr1    AT1G14080   BraA06g010230.3C
A6_Chr1_4   Chr1    AT1G14100   x
A6_Chr1_4   Chr1    AT1G14110   x
A6_Chr1_4   Chr1    AT1G14120   x
A6_Chr1_4   Chr1    AT1G14130   BraA06g010280.3C
A6_Chr1_4   Chr1    AT1G14140   x
A6_Chr1_4   Chr1    AT1G14150   x
A6_Chr1_4   Chr1    AT1G14160   x
A6_Chr1_4   Chr1    AT1G14170   x
A6_Chr1_4   Chr1    AT1G14180   x
A6_Chr1_4   Chr1    AT1G14185   x
A7_Chr1_1
A8.r_Chr1_1
A9.r_Chr1_1
A2_Chr1_1
A6_Chr1_1
A7.r_Chr1_1
A1_Chr1_1   A1  BraA01g026830.3C    17161339    17161504    Chr1    AT1G56580.1 21198405    21198568    2.180000e-109   50
A1_Chr1_1   A1  BraA01g026890.3C    17191267    17191318    Chr1    AT1G57550.1 21312544    21312593    3.270000e-24    40
A1_Chr1_1   A1  BraA01g026900.3C    17196325    17196618    Chr1    AT1G57610.3 21337612    21337818    8.840000e-106   84
$ python3 gap_threshold_selection.py -i abc_synteny.success.colinear
$ python3 minimum_block_length_selection.py -i abc_synteny.success.colinear -g <output gap threshold value>
Block no.   Block_start Block_end   Row start # Row end #   # genes in block    N1  N1.r    N2  N2.r    N3  N3.r    N4  N4.r    N5  N5.r    N6  N6.r    N7  N7.r    N8  N8.r
1   AT1G01010   AT1G01560   0   57  58  0.0 0.0 0.0 0.3684210526315789  0.0 0.6666666666666666  0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
2   AT1G01570   AT1G02205   58  123 66  0.0 0.0 0.43283582089552236 0.0 0.0 0.4626865671641791  0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
3   AT1G02210   AT1G14900   124 1491    1368    0.005113221329437546    0.0 0.3951789627465303  0.005843681519357195    0.3915266617969321  0.0 0.0577063550036523  0.1891891891891892  0.0 0.0 0.07596785975164354 0.26004382761139516 0.0 0.0 0.0 0.0