Gene Daro_1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1238
Symbol
ID	3569422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1344695
End bp	1345585
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	51%
IMG OID	637679705
Product	glucose-1-phosphate thymidylyltransferase
Protein accession	YP_284464
Protein GI	71906877
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01207] glucose-1-phosphate thymidylyltransferase, short form [TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.981269
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGTA CACGCAAGGG CATAATACTG GCCGGCGGGG CCGGTACCAG ATTACATCCG 
GCAACCTTGG CAGTTTCCAA GCAACTGCTC CCGATTTACG ATAAGCCGAT GATTTATTAC 
CCGCTCAGTT CGCTGATGCT GGCGGGTATT CGTGATATTT TGGTTATTTC AACGCCACAA 
GACACTCCGC GTTTTCATCA GCTATTGGGG GACGGAAGTC AGTGGGGCAT CAATTTGCAG 
TATGCCATCC AGCCTAGCCC GGATGGCTTG GCTCAGGCTT TCCTGATTGG TTCTGATTTC 
GTCGGAAATG CTGACTCAGC CTTGGTGCTC GGTGACAACA TATTCTACGG CCACGATTTT 
CATCATTTAC TTGCGAATGC TAGCCAGCGA ACAAGTGGCG CTTCGGTGTT CGCTTATCAT 
GTCCATGATC CGGAGCGCTA CGGTGTGGCC GAGTTTAATG CGCAGGGTAA AGTGCTAAGT 
CTTGAAGAAA AGCCCAAGTG TCCGAAGTCC AACTACGCAG TGACTGGCCT CTACTTCTAC 
GACAACCAAG TCGTTGAACT TGCAAGAAGT CTCAAACCGT CAGCGCGCGG AGAACTTGAG 
ATTACTGACC TGAACAGCTT ATATCTTGAG CAAGGTCAAC TCAATGTAGA GATCATGGGG 
CGTGGTTATG CATGGTTGGA TACTGGGACG CACGACAGTT TGCTCGAAGC AGGGCAGTTC 
ATAGCTACCC TGGAAAAACG TCAGGGTCTA AAGGTCGCCT GTCCGGAAGA ACTGGCTTAT 
CGCCAAGGCT GGATTAATGC CGAACAGCTA ACTGCGCTGG CAGTACCACT CGCAAAGAAT 
GGTTATGGCC AATATTTGTT GGCCATGCTC AAGGATAAGG TGATTGGATG A

Protein sequence

MSSTRKGIIL AGGAGTRLHP ATLAVSKQLL PIYDKPMIYY PLSSLMLAGI RDILVISTPQ 
DTPRFHQLLG DGSQWGINLQ YAIQPSPDGL AQAFLIGSDF VGNADSALVL GDNIFYGHDF 
HHLLANASQR TSGASVFAYH VHDPERYGVA EFNAQGKVLS LEEKPKCPKS NYAVTGLYFY 
DNQVVELARS LKPSARGELE ITDLNSLYLE QGQLNVEIMG RGYAWLDTGT HDSLLEAGQF 
IATLEKRQGL KVACPEELAY RQGWINAEQL TALAVPLAKN GYGQYLLAML KDKVIG