Gene Cthe_2268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2268
Symbol
ID	4809857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2696804
End bp	2698186
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	48%
IMG OID	640107674
Product	V-type ATP synthase subunit B
Protein accession	YP_001038663
Protein GI	125974753
COG category	[C] Energy production and conversion
COG ID	[COG1156] Archaeal/vacuolar-type H+-ATPase subunit B
TIGRFAM ID	[TIGR01041] ATP synthase archaeal, B subunit

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAAGG AATACAGAAC AATAACCGAG GTTGCCGGTC CTCTCATGCT GGTACAGAAA 
GTTGAAGGTG TAAAATACGG CGAACTCGGT GAAATAGAGC TGGCAAACGG TGAAATAAGA 
AGATGCAAGG TATTGGAAGT TGACGGGCAA AACGCATTGG TTCAGCTTTT TGAAAGTTCT 
ACAGGTATAA ACGTTGCAAC CAGCAAAGTA AGGTTTTTGG GAAGAAGTAT AGAGCTTCCC 
GTATCAATGG ATATGCTCGG AAGAGTATTC AGCGGTATGG GAAAGCCCCT GGACGGCGGT 
CCGAATATTA TTCCCGACAA AAGGCTTGAC ATAAACGGTC TTCCTATGAA CCCAGCGGCA 
AGAAACTACC CTTCGGAGTT CATACAGACG GGTATTTCGG CCATTGACGG ACTGAACACC 
CTGGTTCGCG GCCAGAAGCT CCCCATATTC TCCGGTTCCG GTCTTCCCCA TGCCCAGCTT 
GCGGCACAAA TTGCAAGGCA GGCAAAGGTT TTGGGTACGG ACAGCAAATT TGCCGTTGTA 
TTTGCGGCTG TAGGTATTAC CTTTGAGGAA GCTGACTACT TTATCAGTGA CTTTAAGAGA 
ACCGGAGCCA TAGACCGTAC CGTACTGTTT ATAAATCTGG CAAACGACCC TGCCATCGAG 
CGTATTTCAA CTCCACGTAT GGCGCTTACG GCAGCCGAAT ACCTTGCTTT TGACAAAGGC 
ATGCACGTGC TCGTTATAAT CACCGACATA ACCAACTACG CCGAAGCGCT CCGTGAAGTA 
TCCGCCGCAA GAAAAGAAGT TCCCGGAAGA AGAGGTTACC CGGGTTACCT TTATACCGAC 
CTTGCGACAA TATATGAAAG AGCCGGAAGA AGAATTGACA GCGAGGGAAG TATCACTTTG 
ATTCCAATAC TGACAATGCC CGAAGATGAC AAGACCCATC CTATCCCCGA CCTTACCGGA 
TACATAACCG AGGGTCAGAT CATCCTAAGC AGAGAGCTTC ACCGCAAGGG AGTAACGCCA 
CCGATAGACG TTCTTCCGTC CCTCTCCCGT CTTAAGGACA AGGGAATCGG AAAAGGCAAA 
ACCCGTGAAG ACCATGCGGA TACAATGAAC CAGCTCTTTG CCGCTTACGC AAGGGGTAAG 
GAAGCCAAGG AACTTGCCGT AATCCTCGGA GATGCGGCTC TTTCCGACAC GGATAAGCTG 
TACGCCAAAT TTGCGGATGC TTTTGAAAAG GAATATGTAT CCCAAGGTTT TAATGAAGAC 
AGATCAATTG AAAAAACCCT TGAAATCGGC TGGAAGCTGC TTTCAATACT TCCAAGATCG 
GAGCTTAAGC GTATTCGTGA CGAATACCTT GACAAATATT TGCCCAAAGC GGCAGAAAAT 
TAA

Protein sequence

MLKEYRTITE VAGPLMLVQK VEGVKYGELG EIELANGEIR RCKVLEVDGQ NALVQLFESS 
TGINVATSKV RFLGRSIELP VSMDMLGRVF SGMGKPLDGG PNIIPDKRLD INGLPMNPAA 
RNYPSEFIQT GISAIDGLNT LVRGQKLPIF SGSGLPHAQL AAQIARQAKV LGTDSKFAVV 
FAAVGITFEE ADYFISDFKR TGAIDRTVLF INLANDPAIE RISTPRMALT AAEYLAFDKG 
MHVLVIITDI TNYAEALREV SAARKEVPGR RGYPGYLYTD LATIYERAGR RIDSEGSITL 
IPILTMPEDD KTHPIPDLTG YITEGQIILS RELHRKGVTP PIDVLPSLSR LKDKGIGKGK 
TREDHADTMN QLFAAYARGK EAKELAVILG DAALSDTDKL YAKFADAFEK EYVSQGFNED 
RSIEKTLEIG WKLLSILPRS ELKRIRDEYL DKYLPKAAEN