Gene Athe_1182 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1182
Symbol
ID	7408764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1276024
End bp	1277052
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	34%
IMG OID	643715547
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_002573055
Protein GI	222529173
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.794723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATAA AAAGATATTA TAAAGTAATT ACCTTCGTTA TATTGCCAAT TGCTTTTCTA 
TTTCTCCTTT CAGGATGCTA TGCAAGAAAA AAAGACAAAA ATCTAAAGGT AAGAATTGCA 
TTTTTCCCGA ACATAACTCA TGCCCAAGCA TTGGTAGGGA AAGAACTTGG TATTTTCCAA 
AAGAGAATAG GCAAGGATGT AAAAGTTGAA TATAAGGTTT TCAATGCAGG TCCGGCTGAG 
ATAGAAGCGT TTTTAGCAGA TGAGGTTGAC ATAGGCTATA TTGGACCTAT ACCAGCGATA 
AATGGATTTG CAAAGACAAA TGGAGAAATA AAGATTATTG CAGGAGCTAC AAACGGAGGA 
ATGATGCTGG TTTCAAGGCA GGATTTGAAT ATAAAGAATT TAGATGACTT AAAAGGCAAG 
AAAATTGCAG TTCCTCAATA TGGGAATACC CAAGATATTG TATTAAGGTT TTTGCTAAGC 
AAAGCTGGGC TAAAAGATAC TACCAAAGGT GGAGATGTTG AGATTATTCA AGCTGAAAAT 
CCAGACATTA AAACTTTGCT TGATAGAAAC CAGATAGATG CTGCGTTGGT TCCTGAGCCT 
TGGGGAACAA GGTTGAAAAA AGAAGTAAAT AGCAATGTTG TGCTTGACAG TAGCCAAATA 
AGGCAATACA TAGATATTCC TACAACAGTA ATTATTACTA CCACAAAGTT TTTAAAAGAG 
TATTCTGATA TTGTAGAAAA ATTTCTCATA GCGCATCTTG AGGTAACAGA CTTTATTGAA 
AAAAATCCTG AAAAATCATA TGAAATAATA AATAACCAAA TTTCTGAGAT AACTTCTAAG 
CCGCTGCCGG CAGACATCCT AAAAGACTCC TTCAAAAATA TCAAACTTTC AAGCGAAATA 
CAAAGGAAAT CCTTAGAAAA AGCAATTGAG TCATATTTTG AGTTGGGATA CTTAAGAGAA 
AAGCCAAATA TTGAAAAATT AGTTAACACA GAAATTTTAG ATAGAATCAA AAACAAAGAG 
GTGTACTAA

Protein sequence

MEIKRYYKVI TFVILPIAFL FLLSGCYARK KDKNLKVRIA FFPNITHAQA LVGKELGIFQ 
KRIGKDVKVE YKVFNAGPAE IEAFLADEVD IGYIGPIPAI NGFAKTNGEI KIIAGATNGG 
MMLVSRQDLN IKNLDDLKGK KIAVPQYGNT QDIVLRFLLS KAGLKDTTKG GDVEIIQAEN 
PDIKTLLDRN QIDAALVPEP WGTRLKKEVN SNVVLDSSQI RQYIDIPTTV IITTTKFLKE 
YSDIVEKFLI AHLEVTDFIE KNPEKSYEII NNQISEITSK PLPADILKDS FKNIKLSSEI 
QRKSLEKAIE SYFELGYLRE KPNIEKLVNT EILDRIKNKE VY