Gene Aazo_3791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3791
Symbol
ID	9341596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3851123
End bp	3852388
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	39%
IMG OID
Product	6-pyruvoyl tetrahydropterin synthase and hypothetical protein
Protein accession	YP_003722447
Protein GI	298492270
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTGTG TAGTCAATCG TCGCGCTCAG TTTTTAGCTA GTCATCATTA TTCGCTACCA 
GAACTAGGCG AAACCGAGAA CTTGGAAAAA TTTGGTCGTT CCTCAAAATT TCCCGGGCAA 
GGCCACAATT ATACCCTATT CATCTCTATA GCTGGGGAAT TAGATAAATA TGGTATGGTG 
CTAAATTTAT CTGATGTCAA ACAAGTAATT AAGCGGGAAA TAACCGATCA ATTAGATTTT 
TCTTACCTTA ATAATGTGTG GCCAGAATTT CAACAAACTT TGTCCAGTAA TGAAAATATT 
GCACGAGTGA TCTGGCAGCG TTTAGCCCCT CATTTGCCTC TAATTCGCGT CCAGTTGGTT 
GAACATACTG GGCTTTGGGC AGATTATATG GGAGAAGGAA TGCAAGCTTC TCTCAGCATC 
AGCACCCACT TTAGCGCCGC CCATCGTTTG GCTTCTAACC TCAGTTCTGA AAAGTATAGT 
AAATGTAGCC GTACACATGG ACACAACTAC CATTTAGAAG TGACTGTAGA AGGGGAAATG 
GACTCACGAA CAGGGATGAT CATTGATTTA GATGCCCTAA ATAGAGTTGT TGAAAATGAT 
GTAGTCAAAA TCTTTGATCA CTTCTGTGTA AATAAAGATA TTCCTCATTT TTCCGAAATT 
GTCCCGACTA CCGAAAATCT TGTACTTTAC ATTAGCAACC TACTCAAATC ACCTATTCAG 
AAATTAGGGG CAAAACTGTC TCAAGTTAAG CTGTTTGAAA GTCCTCAACT CTGGGTAGAT 
TATCAGGGTA ATGGAACAGA AACGTTCCTC ACCGTGAAGA GTGAATTTAG TTCTGCACAC 
AGATTAGCTC ATCCTGGTTT GAGTTTAGAA AAAAATACAG AGATTTACGG TAAATGCGCC 
CGTGTGAATG GACATGGACA TAACTATCAA TTAGAAGTGA CAGTGAAGGG TGAAATCGAC 
TCCAGCACAG GTATGGTGGT TGATTTAGGT GCTTTAAATC AGGTAATTGC TAATTTAACT 
GAACCCCTTG ATCACAGTTT CTTAAATAGA GATGTTCCCT ATTTTGGGGA AGTTGTACCA 
ACAGCAGAAA ATATTGCTCT TTATATTAGT AATATGTTGC GCTTGCCTAT TCAAGAACTA 
GGAGCAGAAC TTTACAAAGT TAAACTAGTT GAAAGTCCTA ACAACTCCTG CGAAATCTAC 
CCATCTGACA TAGAATCAAC ATCTGTGATC ACAGTACAGA ATCAGCCTGT TTTAGCGACA 
GTTTAA

Protein sequence

MQCVVNRRAQ FLASHHYSLP ELGETENLEK FGRSSKFPGQ GHNYTLFISI AGELDKYGMV 
LNLSDVKQVI KREITDQLDF SYLNNVWPEF QQTLSSNENI ARVIWQRLAP HLPLIRVQLV 
EHTGLWADYM GEGMQASLSI STHFSAAHRL ASNLSSEKYS KCSRTHGHNY HLEVTVEGEM 
DSRTGMIIDL DALNRVVEND VVKIFDHFCV NKDIPHFSEI VPTTENLVLY ISNLLKSPIQ 
KLGAKLSQVK LFESPQLWVD YQGNGTETFL TVKSEFSSAH RLAHPGLSLE KNTEIYGKCA 
RVNGHGHNYQ LEVTVKGEID SSTGMVVDLG ALNQVIANLT EPLDHSFLNR DVPYFGEVVP 
TAENIALYIS NMLRLPIQEL GAELYKVKLV ESPNNSCEIY PSDIESTSVI TVQNQPVLAT 
V