Gene Daro_3740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3740
Symbol
ID	3567375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4018672
End bp	4019649
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	66%
IMG OID	637682214
Product	thiamine-monophosphate kinase
Protein accession	YP_286939
Protein GI	71909352
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.129038
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGCG AATTCGCGCT GATCGACAAG TACTTCGCCC GGCCGACCCC GTCGGCTATC 
CTCGGCCCCG GCGACGACTG CGCCTTGGTC CAGCCCTCAC CGGGCAAGCA ACTGGCCATC 
ACCACGGACA TGCTGGTGGC CGGCACACAC TTCCTGCCCG GCACCGACCC GAAGAATCTC 
GGCTGGAAAG CCCTCGCCGT CAATCTCTCC GACCTCGCTG CGATGGGCGC CCAACCGCGC 
TGGGTCACGC TGGCCGGCGC CTTGCCGAGC GTTGACGAGG CCTGGATCGC CGCCTTCGCC 
AGCGGCTTCT TCAACTGTGC CCAGGAATAC GGCGTCGACG TCATCGGCGG CGACACCACC 
AAGGGCCCGC TCAACGTCTG CATCACCGCC ATCGGCGAAG TCGAACCCGG CCAAGCCCTG 
CGCCGCGATG GCGCCAAGGT CGGTGACCAG ATCTGGGTAT CCGGCCGTCC CGGCCTCGCC 
GCCCTCGGCC TCGCCTATCT GCAAGGCAAG GTCAAGCTGC CAGAACCGTG GCCACGGCTA 
TGCGTCGGCG CCCTCGAAAA GCCGCGCCCG CGCGTTGCCC TCGGCCTCGC ACTGACCGGC 
ATCGCCAGTG CCGCGATCGA TGTTTCCGAC GGTCTGCTGG CCGACCTCGG CCACATTGCC 
GAACGCTCTG CCTGTGCAGC CGCCGTCAAA CTCGTTCAGC TACCGCACCT GCCCAAGGGC 
GAAAGCTACG ATGCCGACCT TCGACGCATT GCCCTCGAAT GCCAGCTGGC CGGTGGCGAC 
GATTACGAAC TCTGCTTCAC TGCCCCCGGT AGCCAAAGTC TGGCCATTGC GCAAATTGCC 
GCCCAACTCG AATTGCCGCT GTGGAACATT GGCGAAATGG TGACCGGCCA GGCTGGCGAA 
GTCGCTGTAT TCGACCCGGA CGGCAAGCCG GTCGAGTTCA ATCACAAGGG ATACGAGCAC 
TTTGGCGCCG AAACCTGA

Protein sequence

MAGEFALIDK YFARPTPSAI LGPGDDCALV QPSPGKQLAI TTDMLVAGTH FLPGTDPKNL 
GWKALAVNLS DLAAMGAQPR WVTLAGALPS VDEAWIAAFA SGFFNCAQEY GVDVIGGDTT 
KGPLNVCITA IGEVEPGQAL RRDGAKVGDQ IWVSGRPGLA ALGLAYLQGK VKLPEPWPRL 
CVGALEKPRP RVALGLALTG IASAAIDVSD GLLADLGHIA ERSACAAAVK LVQLPHLPKG 
ESYDADLRRI ALECQLAGGD DYELCFTAPG SQSLAIAQIA AQLELPLWNI GEMVTGQAGE 
VAVFDPDGKP VEFNHKGYEH FGAET