Gene Aazo_5011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5011
Symbol
ID	9342818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5130609
End bp	5132102
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	37%
IMG OID
Product	thymidylate synthase
Protein accession	YP_003723247
Protein GI	298493070
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACACA CAGGTCAAAC AACTCAATTT CGTTACACAG CCCAACATAA GCCTAACCAG 
TTGATTTATG GAAATGGGCA AACAGCAGTA ATTACAGGGT GGACAGTCAA GCAAGCGATC 
ACTAAACACC TGCAACCCTC AGATTACGCC GTTATCGGTC AGTTGTACTC TCCCACCAGA 
GGGATAAATT TACTCATCCG TAATTTATTA TTAAATCCCC ATGTTCGTTA TTTAGTAATT 
CTTAACGCCA CCAAAGAAGA TAAAAACGCA GGTGCTTCTC AATGCTTACT CGACTTTTTT 
CACAATGGTG TTGAAGAAAG TTTAAGTGAC ACCGGACGTA AATCCTGGAA AATTCTTTCT 
GCCATTCCTG GTTATATTGA AATTGATATT GATATTAATT CCTTAGGAAA ACTCAGACAT 
TCAATAGAAG TTCAAGAAGC TAAATCAATT ACACAAGCAG TTAATTTAGT TAAAAAGTAC 
TCTCAAAGAG AAATAATTGA GCCTTGGGGA TTTCCATTAG AATTTCCCAT GTCTACCGTT 
GAACCCACAG TTTTACCTGG TTCACGTTAT GGACATCGCA TAGAAGGTAA AACCATAGCT 
GAAACTTGGG TAAAAATTAT TCATCGCATT AAAACCACAG GCACAATAAG ACCAACTGGC 
TATGATGGCA AATGGCAAGA ATTAATAGAT ATGATAGCAG TTATCACCGA TGAACCTGCT 
GATTTTTATT TTCCTGAACC AAATTATTTA CCAATTCATA GAAGCTTTCT AGAACAATAT 
ATTTCTCAAA TTTTAGATGA TTCACCTAAT CGTGAAGGAG TGAAATATAC CTATGGTCAA 
CGTTTGCGTT CTTGGTTTGG ACGAGATCAA ATTGAGCAGG TGGTTAATAA ATTAGTTGGA 
GAAATTGATG CGGCTAGTGC AGTCATGACA TTATGGGATG TAAAAGATCA TGATCAAGGT 
GGCAGTCCTT GTTTGAATCA TATTTGGCTG AGAATTGTTG ATAATGAATT ATCACTAACT 
GCGACTCTCA GAAGTAATGA TATGTTTGCC GCTTGGCCTG CAAATGCAAT GGGATTAAGA 
GCTTTGCAAA AACATATTAG AGATGAAATT GCTAAACGTT CTGAATATGA TTTGAAAATG 
GGACCACTAA TAACTCTGAG TCAGTCAGCT CATATATATG ATGATACTTG GAGCAATGCA 
GAACAACTGA TTCAAGAACA ATATGTGGCT ATTTGCAGGA ACATAGATTA CTATGATCCC 
ACAGGAAACT TTTTAATTGA AATTGCAGAT GGTCAAATTG TTGTCACACA TACAACCCCC 
GGTAGTGGGG AGATTGTCGG TTGCTACTAT GGTAAAAATG CTCTAAAATT AGTCAGAGAA 
ATTTGTGCTG CTTCCCCTGC AATACGTCCA GATCATGCTG CATATTTAGG TTTGGAATTG 
CAAAAAGCGG CAGACTGTAT TAAACTTGAC AAGTCATATA TTCAAGATAA GTAA

Protein sequence

MTHTGQTTQF RYTAQHKPNQ LIYGNGQTAV ITGWTVKQAI TKHLQPSDYA VIGQLYSPTR 
GINLLIRNLL LNPHVRYLVI LNATKEDKNA GASQCLLDFF HNGVEESLSD TGRKSWKILS 
AIPGYIEIDI DINSLGKLRH SIEVQEAKSI TQAVNLVKKY SQREIIEPWG FPLEFPMSTV 
EPTVLPGSRY GHRIEGKTIA ETWVKIIHRI KTTGTIRPTG YDGKWQELID MIAVITDEPA 
DFYFPEPNYL PIHRSFLEQY ISQILDDSPN REGVKYTYGQ RLRSWFGRDQ IEQVVNKLVG 
EIDAASAVMT LWDVKDHDQG GSPCLNHIWL RIVDNELSLT ATLRSNDMFA AWPANAMGLR 
ALQKHIRDEI AKRSEYDLKM GPLITLSQSA HIYDDTWSNA EQLIQEQYVA ICRNIDYYDP 
TGNFLIEIAD GQIVVTHTTP GSGEIVGCYY GKNALKLVRE ICAASPAIRP DHAAYLGLEL 
QKAADCIKLD KSYIQDK