Gene Athe_2029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2029
Symbol
ID	7408242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2141072
End bp	2142652
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	34%
IMG OID	643716396
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_002573879
Protein GI	222529997
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGTA AAAAAATATT TGCGATTTTT CTGACAATTA CTTTTTTAGT ATCTATTGTA 
ACTCTGGGAT TTTCATTTGG AAAAGCAGCT ACATCTAAAA AGCTAATTAC AATTACTACT 
CATACAACTT CGAGCCAACC ACCAGCAGTT ACAGATTTGT ATAAAAAGAA ATTGAGAGAA 
AAATTTGGCA TTGATTTAAA AACAATATAT ATTCCTCAAA GTGACTATGT TACAAAAATG 
TCTTTGCTTT TTGCAAGTAA TATGGCACCA GACTGGATAC GTGCTTTAAG GCCTGAGTAT 
AATTTAAATG AATGGATTGC AGCAGGATAT TTGATTGGTT TTACCACGGA TGAAATAAAA 
AAGAAATGGC CTAATTACCT AAAAATATGG ACAAAGGAAG AATGGGATTA CCTCTATAAA 
ATAGTACGTT ACAGTGATGG CAAGGTTTAT TCTTTCCATG GTAGGCGCAT AGCACCAGTG 
GATATGGCTT TCTTGTACAG AAAAGAGATA TTTGATAGAT ATAATTTAAA GTTTCCAACC 
ACAGTTGATG AGTTTTATAA AACATGTATA TTCTTAAGAC AGAAAACAGG TAAAGTTGTT 
TATCTGCACG CAAATGCAGT TTCTGGTAAT TTAAGTCTTT GGGCTTTTAC TGGGATATTC 
TTAATGTATG GTTTGCCTGA ACTTGCACCA AGACAGATTT CTTATGTAGA CCCACTTACC 
AAGAAATTTG TACCTTTTGC GTTCAATCAA AATAATTACC GTCAAGCTTT AATTTTAATA 
AATAAACTTT ATAAAGCAGG TTGTATATGG AAGGAATATG CAACAGCAAC TCGTGATCAG 
TTAGATAAGT TCAGAACCCA AGGGCAAGGA ATAATTATGT GGGCATATCC TGCAAATATA 
GGAACTTACA ACAATCTGTA TAGAAATACA GATAAGGATA CAAACTGGGT ATGGTCTAAG 
GATACACCAA CAGCATATCC TGGAAAAGCG TACTTTTTCA AGAGAAATCC TTTGCACTTT 
GCAGATGGTC ATGGGTTTAA TTCAAGCATC AGCAAAGAAA AGTTAGATAG ACTTCTCCAA 
TATTTGAACT GGGCTCTTAG TGAAGAAGGT CAGATATTCC ATACTTATGG TGAATATGGT 
GTTACTTATA AAAAGGAAGG AAACAAATAC GTATATATGG ACCATATTCA AACTCCAACC 
AATCCATCGG GTAAATATAG CTTACAAGAC TATGGATTTC CATTTGCAGC ACCGAACGGG 
TTTATGGTGG CATATCCTCA GGCTGTAGAA ACATATGCTC CTATATATGC AGAACTTGCA 
AAAACGTTTA TGAATAGGCC AAAGTATTAC TACATCAGGG AAGAACCTAT GATGTATACA 
AAAGAAGAAA TGGCAGAAAG AGCTGAGTTA GAATCAAATA TTATGGCAGT TGTGGATGAA 
TATTGCATGA AGTTTGTAAC AGGTCAGTTA GACCCAAGTA ATAACAAAGA TTGGCAACAA 
TATCTGAATG TTCTCAATAA AGTTGGTCTA CAACGCTTGA TAACAATTAG GATAAATGCA 
TACAATAGAG CTAAGAAGTA A

Protein sequence

MKGKKIFAIF LTITFLVSIV TLGFSFGKAA TSKKLITITT HTTSSQPPAV TDLYKKKLRE 
KFGIDLKTIY IPQSDYVTKM SLLFASNMAP DWIRALRPEY NLNEWIAAGY LIGFTTDEIK 
KKWPNYLKIW TKEEWDYLYK IVRYSDGKVY SFHGRRIAPV DMAFLYRKEI FDRYNLKFPT 
TVDEFYKTCI FLRQKTGKVV YLHANAVSGN LSLWAFTGIF LMYGLPELAP RQISYVDPLT 
KKFVPFAFNQ NNYRQALILI NKLYKAGCIW KEYATATRDQ LDKFRTQGQG IIMWAYPANI 
GTYNNLYRNT DKDTNWVWSK DTPTAYPGKA YFFKRNPLHF ADGHGFNSSI SKEKLDRLLQ 
YLNWALSEEG QIFHTYGEYG VTYKKEGNKY VYMDHIQTPT NPSGKYSLQD YGFPFAAPNG 
FMVAYPQAVE TYAPIYAELA KTFMNRPKYY YIREEPMMYT KEEMAERAEL ESNIMAVVDE 
YCMKFVTGQL DPSNNKDWQQ YLNVLNKVGL QRLITIRINA YNRAKK