Gene Gdia_3537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3537
Symbol
ID	6976989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3869830
End bp	3870804
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	74%
IMG OID	643393056
Product	thiamine-monophosphate kinase
Protein accession	YP_002277875
Protein GI	209545646
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.719113
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCCG CTCTTCCCCC CGCCGGTCCG CTGCCGCCCG AATTCGGCTT CATCCGCCGC 
CATTTCCTTG CCCTGGCGGG CGAGGGCGCG CTGGGCCTGA CCGACGACGC GGCGCTGCTG 
CGCGCGCCGG CGGGGCGGGA ACTGGTCGTC GCGGTCGATA CGATGGTCGA GGGCGTACAT 
TTCCTGCCCG ACGACCCGGC CGACACGGTC GGCCGCAAGC TGCTGCGCTG CAACCTGTCC 
GACCTGGCGG CGATGGACGC GATGCCGCTG GGCTATCTGC TGGCGGTGAC CACGCCGCCG 
GCACGGGACG AGGCCTGGTT CGCCGGTTTC GCCCGGGGCC TGGCGGACGA TCAGGGGCGT 
TATGGGCTCA GCCTGCTGGG GGGCGATACC ACTTCCACGC CGGGGCCATT GGTGCTGTCG 
CTGACCATCC TGGGGCATGG GGCACCCGGC CGGGCCCTGC GGCGCAACGG CGCGCGCGAC 
GGCGACGGGA TATGGGTGAC CGGGACGATC GGCGACGGGG CGCTGGGCCT GCGCGCCCTG 
CGCGGGGAAG TGGCCGATCC CGACGGGTTC CTGGCCGGCC GCTATCGGCT GCCGCGGCCG 
CGCCTGGGGC TGGGGTTGGG CGGAATCGCG TCGGCCGCCA TGGATGTCTC GGACGGGCTG 
GTGCAGGATC TGGGCCACTT GGCCCGTGAA AGCGGCGTCG GCGCCCGGAT CGACGCCGGC 
CGCGTTCCCC TGTCGCCGGC CGCCAGGCAG GCGGGCCCCC GCTGGCTGCC GACCTGCCTG 
ACCGGCGGGG ATGATTACGA ATTGCTGCTG GCCGTGCCCC CGGCGCACGA GGGCGCCCTG 
CGGGAAGCCG CCCGGACGCA TGGGGTGGCG GTCACGCGGA TCGGCGCGTT CGACGCCACG 
CTATCCGGCG TCCAGGTACT GGACGGGGTA GGGGGAATCC TGGCGCTGGA GCGCACCGGA 
TGGAGTCACC TGTAG

Protein sequence

MSAALPPAGP LPPEFGFIRR HFLALAGEGA LGLTDDAALL RAPAGRELVV AVDTMVEGVH 
FLPDDPADTV GRKLLRCNLS DLAAMDAMPL GYLLAVTTPP ARDEAWFAGF ARGLADDQGR 
YGLSLLGGDT TSTPGPLVLS LTILGHGAPG RALRRNGARD GDGIWVTGTI GDGALGLRAL 
RGEVADPDGF LAGRYRLPRP RLGLGLGGIA SAAMDVSDGL VQDLGHLARE SGVGARIDAG 
RVPLSPAARQ AGPRWLPTCL TGGDDYELLL AVPPAHEGAL REAARTHGVA VTRIGAFDAT 
LSGVQVLDGV GGILALERTG WSHL