Gene Athe_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1996
Symbol
ID	7408210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2106059
End bp	2107417
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	38%
IMG OID	643716372
Product	gluconate transporter
Protein accession	YP_002573856
Protein GI	222529974
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG2610] H+/gluconate symporter and related permeases
TIGRFAM ID	[TIGR00791] gluconate transporter

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAACTG GACCTATGCT TTTAGTCATC TTCGTTCTTG CGATGGCATT TGTGCTCGTC 
TCAATTATTA AATTTAAGTT AAACCCGTTT TTATCCTTAA TTATTACCGG TATTATAACA 
GCGTGGTTGG TGGGAATGCC TTTATCACAA ACAGCTTCAA ACATTGCAGA AGGTTTTGGG 
AGTACTCTAA AAGGAATAGG CATTGTAATA GGTCTAGGTA TAATTTTAGG ACAGATTCTT 
GCGGAAGCAG GAGCCACTGA ACAAATTGCA AATGGACTCA TCAAAAAAGT AGGCTCAAAG 
AATTCTCCAT TGGCAGTCAA TATAACAGGT TTTCTGGTTT CTATCCCTGT TTTCTTTGAT 
GCAGCGTTTG TTATTTTGAT ATCACTCATC AAGCAAATCT CAAGAAAAAC AAAAATTTCC 
TTTATTACTT TTGTAACAGC TTTAGCAGTA GGTTTGATAG TTACTCATGC AACTGTTATT 
CCAACTCCAG GACCAGTAAC TGTTGCAAGC AATATGGGTG TTAATATGGG TGTATTTACA 
TTTTACAGTA TCATAGTTGC TCTTCCTGCA GCACTGATCG GAGGGTGGCT GTATGGGCTG 
TACCTTGGCA AAAAGTATCC TTTCACTGAA GATGAAGTCA AAGGGGATTT CAGAAATGAG 
GAACAAATTA CTTCAAACGG AAAACAGCCA TCATTATTTC TCTCGCTCTT TGTTCTCCTC 
TTACCTATTG TATTGATCCT TTTAGGTACT GTTTTGTCAG TCCTTCTTCC GAAGAATTCG 
GCTATGTCAG TGTTCTTTTC GTTTCTTGGC GATAAGAATA TTGCACTTTT AATTGGTGTG 
ATAGTAGCAA TATTGGCAAT GAAACCATAT CTCAAAGATT CTATAGAAAA TGTTATTTCA 
CGTGCGGCAA CATCCGCAGG GATGATTTTG TTAATAACAG GTGCTGGTGG TTCTTTTGGC 
AAAATTATAA ATGAAAGTGG TATAGGAAAT TATGTTGTTG AAACATTCTC ACGCATGAAT 
ATTCCGATGG TCGTTTTAGC ATTTGTTTTG AGTCAATTGT TAAGGGCTGC CCAAGGGTCT 
ACTACAGTTG CATTGGTAAC CACATCCTCT ATACTTGGTC CTCTAGCTGC TAAATTGGGT 
GTCTCGCCAG TTTTAGTTGG TCTTGCAATT TGCGCAGGAG GAATAGGTTT ATCATTACCA 
AATGACTCTG GGTTCTGGGT CGTTAACAGA TTTTCTAAGT TCGATATAAA GAAAACTATG 
GAAGCATGGA CAGTAGGTGG CACTATTGCA GGGGTAATAG CGTTTATTAT GGTGTTAATA 
CTTAACATAT TCGCAAGCAA ATTGCCTGGT CTACATTAA

Protein sequence

MVTGPMLLVI FVLAMAFVLV SIIKFKLNPF LSLIITGIIT AWLVGMPLSQ TASNIAEGFG 
STLKGIGIVI GLGIILGQIL AEAGATEQIA NGLIKKVGSK NSPLAVNITG FLVSIPVFFD 
AAFVILISLI KQISRKTKIS FITFVTALAV GLIVTHATVI PTPGPVTVAS NMGVNMGVFT 
FYSIIVALPA ALIGGWLYGL YLGKKYPFTE DEVKGDFRNE EQITSNGKQP SLFLSLFVLL 
LPIVLILLGT VLSVLLPKNS AMSVFFSFLG DKNIALLIGV IVAILAMKPY LKDSIENVIS 
RAATSAGMIL LITGAGGSFG KIINESGIGN YVVETFSRMN IPMVVLAFVL SQLLRAAQGS 
TTVALVTTSS ILGPLAAKLG VSPVLVGLAI CAGGIGLSLP NDSGFWVVNR FSKFDIKKTM 
EAWTVGGTIA GVIAFIMVLI LNIFASKLPG LH