Gene Cthe_1862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1862
Symbol
ID	4809413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2207255
End bp	2208367
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	41%
IMG OID	640107281
Product	ABC transporter related protein
Protein accession	YP_001038276
Protein GI	125974366
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCG TTAAACTTAA AGGTGTGTAC AAAAGATATC CAGGTGGGGT TACTGCGGTA 
AACGACTTTA ATTTGGATAT TGAAGACAAG GAATTTATTA TATTGGTAGG ACCGTCTGGA 
TGTGGAAAAA CTACAACATT GAGAATGGTT GCCGGATTGG AAGAAATTAC GGAAGGTGAG 
CTTTATATAG GTGACAAACT GGTCAACGAC GTGGCACCTA AAGATAGAGA TATAGCGATG 
GTTTTCCAGA ACTACGCTTT GTATCCGCAT ATGTCTGTGT TTGACAACAT GGCATTTGGA 
TTGAAGCTTA GAAAAGTTCC CAAAGATGAG ATTAAGAGGA GAGTTTTGGA GGCTGCAAAG 
ATTCTTGACA TAGAACACTT GCTGGAAAGA AAGCCGAAGG CATTGTCCGG AGGTCAGAGA 
CAGAGGGTTG CGCTTGGACG TGCCATAGTT CGTAATCCTA AGGTATTCTT GATGGATGAG 
CCTCTGTCAA ACCTTGACGC AAAACTCAGA GTTCAGATGA GAACCGAAAT CAGCAAGCTG 
CACCAGAGAC TTCAGACAAC ATTCATCTAC GTTACTCACG ACCAGACAGA AGCTTTGACG 
ATGGGTACAA GAATTGTTGT TATGAAAGAC GGATACATTC AACAGGTTGA TACTCCTACA 
AATCTTTATG AGAGACCTTG CAACATGTTC GTAGCAGGAT TTATCGGAAG CCCGCAGATG 
AACTTTGTAA ATGCAAGAAT TGAAAAACGC GGGGATGAAA TGCACCTTCT GTTTGGAAAA 
CAGGATATTA AACTTCCGGA AGGAAAGGCA AAGAAGCTTG AGTCCAGCGA ATATGTGGGC 
AGAGAAGTGG TAATGGGTAT ACGTCCTGAA AACATTCGTG ATGAAGAGAT TTATCTTGAA 
TCAATGTCTG AGAATGTTGT AGAGGGAAGA GTTGAAGTTG TTGAAATGCT CGGTTCCGAA 
ACATTGATTT ACATGGTAAT AGATGACTTT GAGTTTACTG CAAGAGTTAA TCCGAGATCA 
AAGGCTAGAC CGGGCGATGT GATTAAGGTT GCTTTTGATG CCAACAAGAT TCATCTCTTT 
GACAAGGAAA CTGAAAAAAC AATAATGAAC TAA

Protein sequence

MASVKLKGVY KRYPGGVTAV NDFNLDIEDK EFIILVGPSG CGKTTTLRMV AGLEEITEGE 
LYIGDKLVND VAPKDRDIAM VFQNYALYPH MSVFDNMAFG LKLRKVPKDE IKRRVLEAAK 
ILDIEHLLER KPKALSGGQR QRVALGRAIV RNPKVFLMDE PLSNLDAKLR VQMRTEISKL 
HQRLQTTFIY VTHDQTEALT MGTRIVVMKD GYIQQVDTPT NLYERPCNMF VAGFIGSPQM 
NFVNARIEKR GDEMHLLFGK QDIKLPEGKA KKLESSEYVG REVVMGIRPE NIRDEEIYLE 
SMSENVVEGR VEVVEMLGSE TLIYMVIDDF EFTARVNPRS KARPGDVIKV AFDANKIHLF 
DKETEKTIMN