Gene Cag_1546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1546
Symbol
ID	3746546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2026285
End bp	2027334
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	41%
IMG OID	637774086
Product	glucose-1-phosphate thymidylyltransferase
Protein accession	YP_379844
Protein GI	78189506
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000479594
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAAG AACTGATATA TAGTGCGTTT TCAAATAAAA TTGGACATCG AAAACGAGAT 
TGTAACAAAG CAATGAAAGC AATTATTCCT GTTGCGGGTG TGGGCACTCG TTTGCGCCCA 
CATACTTTTT CTCACCCTAA AGTACTACTG AACGTCGCAG GCAAGCCCAT TATTGGCCAT 
ATTATGGATA AGCTGATTGC TGCTGGCATT ACAGAGGCAA TTGTTATTGT TGGCTACCTT 
GGTGATATGA TTGAGGAGTG GCTCTTGCAA AATTACGACA TCAAATTCAC CTTTGTAACA 
CAATCGGAGC TATTAGGGTT GGGGCACGCC ATTTCAATGT GCAAGCCTTA CATTCCTGAA 
GATGAGCCGC TCTTTATCAT TTTGGGAGAT ACTATTTTTG ATGTTAACCT TGAGCCTGTT 
TTAAAAAGCA CCTGTTCAAC AATTGGCGTT AAAGAGGTGG TTGATCCTCG CCGTTTTGGT 
GTAGCCGTTA CTGAAAATGG TGCCATTGTA AAGCTTGTTG AAAAACCCGA CACTCCAGTA 
AGCAACCTTG CTATTGTTGG GCTCTACCTT TTGCAACATT CAGCCGCACT CTTTAAAAGC 
ATTGATTACT TAATTGAGCA CAACATTACC ACAAAAGGTG AATATCAATT AACCGATGCT 
TTGCAGCGCT TGCTTGACGA AGGCGAAAAG TTTACCACCT TCCCTGTACA AGGGTGGTAC 
GATTGTGGTA AACCCGAAAC GCTGCTTGCC ACCAACGAAA TCTTACTGTC CGATAATCCC 
CCATCTAAAA CATACCCTGG TTGCATTATT AACGATCCTG TGTTTATTGC AGAAAGCGCT 
AAACTTGAAA ATGCCATTAT TGGACCTTAC ACCACTATTG GTGAAGATGT GGTTATTAAG 
GATGCCATTA TTAAAAAGTC CATTATTGGC AACAAAGCCC AAGTAAAGCA CATTATGCTG 
GGCAACTCCA TTATTGGCAA TAACGCCATT ATTCGTGGCA CTCCGCATGA AATTAATATT 
GGCGATTTCT CTGAAATTCG TGTAAGCTAA

Protein sequence

MLKELIYSAF SNKIGHRKRD CNKAMKAIIP VAGVGTRLRP HTFSHPKVLL NVAGKPIIGH 
IMDKLIAAGI TEAIVIVGYL GDMIEEWLLQ NYDIKFTFVT QSELLGLGHA ISMCKPYIPE 
DEPLFIILGD TIFDVNLEPV LKSTCSTIGV KEVVDPRRFG VAVTENGAIV KLVEKPDTPV 
SNLAIVGLYL LQHSAALFKS IDYLIEHNIT TKGEYQLTDA LQRLLDEGEK FTTFPVQGWY 
DCGKPETLLA TNEILLSDNP PSKTYPGCII NDPVFIAESA KLENAIIGPY TTIGEDVVIK 
DAIIKKSIIG NKAQVKHIML GNSIIGNNAI IRGTPHEINI GDFSEIRVS