Gene Athe_0399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0399
Symbol
ID	7409334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	458758
End bp	459984
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	39%
IMG OID	643714788
Product	extracellular solute-binding protein family 1
Protein accession	YP_002572306
Protein GI	222528424
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000195685
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TTCTAACAAT TTTATTAACG TTAATTTTCC TACTTTCCTT GGTTGCAGGA 
ATGGGTGCTG CGCAAAAAGA TGTTTTTGCC ACTTCCAAGA TAACTTTAAA GCTGGGTGCG 
TGGGCATCTT CTCCTGCTGA GAAGAAGATT GTTCAAAACC AAATCGCAGC CTTCAAAAAG 
CTCTATCCCA ATGTCGATAT TAAATTAGTT GAAATTGTCG GTGATTATAA TCAAAAAATG 
CAGCTTCTCA TGGCATCTAA AACAGAACCA GATATCTTTT ACATGGATTC AATGCCAGCT 
TGGCAGTACA TTGCAAAGAA TGTCTTAGAG CCGTTTGACA GCTGGATGAA AAAGTACAAT 
GTCAAAACAA TTGGTTATGA GTCATCACTT CTCCAGCCAT TCATATACAA AGGAAAAGTG 
TATGGACTTC CAAAAGACTA CAATACATTA GTTTTGTTCT ACAACAAAGA GATGTTCAAA 
CAAGCAGGTC TTACGCAGCC ACCAAAGACA TGGCAGGAGT TGAAAGAGTA TGCTAAGAAA 
CTTACAACAG ACAAGGTTGT AGGTCTTACA ATGAACCTTG AGCTTGCAAG AATTCAACCT 
TTTGCATACC AAAACGGTGG TAAAGTATTT GACGGTAGTA AGCCAGTCTT TACCGACCCG 
AAAGCCTTGG AAGGCTTAAA ATTTGCACTT GACCTTTTCA AAGAAGGAAT ATGCAAAACA 
CCAAAAGATT TAGGTGCTGG CTGGGTTGGG GATGCATTTG CTGACAAGAA AGCTGCTATG 
ACAATTGAAG GCGGCTGGAT GATTCCATTC TTAAACGACA GAAAGATACC AAAAGATCAA 
TATGGAATTG CAGAACTTCC TGCAGGACCT GCTGGTAAGT CAACAATGGC ATTCACCGTT 
GCATATGTAA TGAGTAAAAA TTCTAAGCAC AAACCTGAAG CGTTCAAACT TATAAGATTC 
TTAACTGGAG AAGGCGGACA AAAGTATGTG GTTGAAGCAG GCTTAGCACT TCCTTCATTA 
AAGAGCGCAG GTGTAAACTT TGCTAAAACT TATCCAGAGA GAAAAGCGCT TGTTGATGGT 
GCAAAATATG CACAGGTCTA CTTCTATGGT CTGGATGGCA CAAAAGTTGT GGATGTCTTC 
AACAAAGCAT TTGAAGACTA TGTAATTGGC AAAAAGTATG ACCTTAAGAA GAACATTGAG 
GAAAGAGTAA AGCAAATCAT GAAGTAA

Protein sequence

MKKFLTILLT LIFLLSLVAG MGAAQKDVFA TSKITLKLGA WASSPAEKKI VQNQIAAFKK 
LYPNVDIKLV EIVGDYNQKM QLLMASKTEP DIFYMDSMPA WQYIAKNVLE PFDSWMKKYN 
VKTIGYESSL LQPFIYKGKV YGLPKDYNTL VLFYNKEMFK QAGLTQPPKT WQELKEYAKK 
LTTDKVVGLT MNLELARIQP FAYQNGGKVF DGSKPVFTDP KALEGLKFAL DLFKEGICKT 
PKDLGAGWVG DAFADKKAAM TIEGGWMIPF LNDRKIPKDQ YGIAELPAGP AGKSTMAFTV 
AYVMSKNSKH KPEAFKLIRF LTGEGGQKYV VEAGLALPSL KSAGVNFAKT YPERKALVDG 
AKYAQVYFYG LDGTKVVDVF NKAFEDYVIG KKYDLKKNIE ERVKQIMK