Gene Aazo_0840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0840
Symbol
ID	9338628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	891246
End bp	892889
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	39%
IMG OID
Product	thiamine pyrophosphate protein domain-containing protein TPP-binding protein
Protein accession	YP_003720383
Protein GI	298490206
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.923558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACGG CAGATTTGTT AGTACAGTGT TTAGAAAATG AAGGAGTGCA ATATGTTTTT 
GGACTGCCAG GTGAGGAAAA TTTGCACGTT TTAGAAGCTT TAAAAAACTC ATCCATTCAA 
TTTATTACTA CTCGTCACGA ACAGGGTGCA GCTTTCATGG CGGATGTTTA TGGGAGGTTA 
ACTGGTAAAG CCGGAGTCTG TCTTTCCACT CTTGGTCCTG GTGCTACTAA TTTAATGACT 
GGGGTTGCAG ATGCTAACCT TGATGGTGCA CCATTAGTAG CAATTACCGG ACAGGTGGGA 
ACAGATAGAA TGCATATTGA ATCCCATCAA TATTTAGATT TAGTGGCTAT GTTTGCGCCA 
GTTACTAAGT GGAATAAGCA GATAGTTAGA CCGAGTATTA CACCAGAAGT TGTGAGAAAA 
GCATTCAAGC GCTCGCAAAC TGAAAAACCT GGTGCAGTCC ACATAGATTT ACCCGAAAAT 
ATTGCTGCTA TGCCCGTAGA AGGCAAACCT TTACATAAGG ATAACAGCGA AAAAACCTAT 
GCTGCTTTTG CTAGTATTCG CGCTGCTGCT GCCATAATTT CTCAAGCAGT TAATCCCATT 
ATCTTAGTGG GAAATGGGGC GATTCGCGCT CAAGCTAGTG ATGCGGTGAC GCAATTCACC 
ACCCAAATAA ATATTCCAGT CGTTAATACT TTCATGGGTA AAGGCGTAAT TCCCTACACT 
CATCCTTTAG CACTTTATTC TGTAGGATTA CAACAAAGAG ATTTCATTAC TTGTGGTTTT 
GATAATACCG ATTTAGTAAT TGCAATTGGC TATGATTTAA TTGAATTTTC TCCCAAAGAA 
TGGAATCCTG ACGGCAAAAT TCCTATTATC CATATTGCTG CTATTTCAGC AGAAATTGAT 
AGTAGTTACA TTCCTAAAGT CGAAGTTATT GGGGATATTT CTGATTCAGT TAATGAAATA 
TTAAAATTAG CAGACAGACA AGGAAAACCC AATCCCTATG CCATCAGTTT ACGTTCTAAT 
ATTCGCGCTG ATTACGAACA ATATGCCCAT GATGATGGCT TCCCAATAAA ACCGCAAAGA 
TTAATTTATG ATTTGCGGCA AGTGATGGGA CCAGATGATA TTGTCATTTC TGATGTAGGT 
GCACATAAAA TGTGGATTGC TAGACATTAT CATTGTCATA GTCCTAATAC GTGCATTATT 
TCCAATGGAT TTGCAGCAAT GGGAATTGCC ATTCCTGGGG CTTTAGCTGC TAAACTTGTC 
TATCCAGATC GTAAAGTTGT AGCAGCTACA GGCGATGGTG GCTTTATGAT GAACTGTCAA 
GAATTAGAAA CAGCTTTGCG TGTTGGTACA CCTTTTGTTA CCTTAATTTT CAATGACGGT 
GGCTATGGTT TAATTGAATG GAAACAAGAA AATCAATTTG GTAAAGGTAA TTCATGTTTT 
GTGCATTTTG GTAATCCTAA TTTTGTCAAA TTAGCCGAAA GTATAGGATT AAAAGGTTAC 
AGGGTTGAAT CAGCAACTGA TTTAATTCCT GTCGTCAAAG AAGCCCTAAT TCAAGATGTT 
CCTGCGGTAA TAGATTGTCC TGTAGATTAT CGAGAAAACC GCCGTTTTAG TCAAAAAGCT 
GGGGAGTTAA ATTGTGATAT TTAA

Protein sequence

MNTADLLVQC LENEGVQYVF GLPGEENLHV LEALKNSSIQ FITTRHEQGA AFMADVYGRL 
TGKAGVCLST LGPGATNLMT GVADANLDGA PLVAITGQVG TDRMHIESHQ YLDLVAMFAP 
VTKWNKQIVR PSITPEVVRK AFKRSQTEKP GAVHIDLPEN IAAMPVEGKP LHKDNSEKTY 
AAFASIRAAA AIISQAVNPI ILVGNGAIRA QASDAVTQFT TQINIPVVNT FMGKGVIPYT 
HPLALYSVGL QQRDFITCGF DNTDLVIAIG YDLIEFSPKE WNPDGKIPII HIAAISAEID 
SSYIPKVEVI GDISDSVNEI LKLADRQGKP NPYAISLRSN IRADYEQYAH DDGFPIKPQR 
LIYDLRQVMG PDDIVISDVG AHKMWIARHY HCHSPNTCII SNGFAAMGIA IPGALAAKLV 
YPDRKVVAAT GDGGFMMNCQ ELETALRVGT PFVTLIFNDG GYGLIEWKQE NQFGKGNSCF 
VHFGNPNFVK LAESIGLKGY RVESATDLIP VVKEALIQDV PAVIDCPVDY RENRRFSQKA 
GELNCDI