Gene Athe_0342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0342
Symbol
ID	7409272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	390273
End bp	391538
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	37%
IMG OID	643714728
Product	major facilitator superfamily MFS_1
Protein accession	YP_002572251
Protein GI	222528369
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAGGT TCAAGGCACA GCTGCAGCAG ATTGTTTTAG CATTCAAAGA GATAAATCCA 
AACGCTAAAA AGATCCTATT TTTTGAGCCC GTTTTTACTA TTCCATATGC TATGTTTATC 
ATCTACTCCT CACTTTACAT GACAAGAGTT GGAGTAAAGG ATTACCAGAT AGGACTGCTG 
TCAACAGTGT TGAACTTGGT GATGCTTATC ACATCACCCT TTGCAGGAAT GCTTGTGAAC 
AGGTTTGGAC GCAAAAAGGT TCTCCTCATT GGCGATTTTC TGTCGTGGTG CGTGTATGCA 
TATATATTTT TCTTTGCCAA AGATTTTGCA TGGTTTTTAA TTGCTACCAT CTTTAACGGA 
CTTATGAGAA TTCCTGAACT TGCATGGCGG CTTCTTTTAA TGGAAGATGC AACCGAAAAC 
GAAAGAGTTG CAATTTATTC TGTAACTGTA TTTGTGTGGA ATATGGGTAA CCTTTTTGCG 
CCTGTGATGG GCGTCCTTGT TGCAAGGTTT GGCTTGATAC CTGCAACTAA ATGGACAGTC 
CTTGCGTTTG GGATTTTAGT AAATATACTA ATTGTTGTAA GACATCTTGT TACATCTGAG 
AGTTCTGTGG GGCAAAAGCT TGTACAGGAA AATTCTGACA AAAATAATAA TGGTTTTTCT 
GAGTGGTTTG ACAGTTTAAA GTATATGTTC AGAAACGGAC AGCTTCTTTT GATTGTGCTT 
GTAACAATAT TTGGCAACGT TGCCCTGATA TTCAGAGACA CATATAAAAA TATATATTTA 
AGCGAAGCTT TGCATTATCC AGATAGCATA ATTTCGGTAT TTCCAACACT GTGGAGTGCG 
GTAGCTCTCA TATTTGTAAT ATTTTTAATT CCAAATTTAA AAGAACAAAA ACATGATACT 
GTCCTTTTTT GGGGAATGTT TTCAATTACA GTTTCCAATG CATTGATTTT AGTTGCACCT 
CCTGGGACAT TTGGCTTTAT TTTGATGATA ATTGTAACAG TGCTTGGCAG CATAGGGGCT 
GCAGTATATT ATTCATTTGT TGATGCTATC TTGGCAAATT CTGTTGATGA TGAAAGAAGA 
GCACATGTCC TGTCAATTAC AATGTTTTTG ATTTCTCTTT TTTCAATGCC AGTTGGTGCA 
ATAGCCGGAC AGTGTTATAC CTTTTCAAAG AGTTTGCCTT TTGTGCTTGC TACAATCTTT 
ACTCTCTTGT GCACAATTTT GATTTTTTTC AAGATAAGAA TAAGAAGAGC CCAAAAAGAA 
AAGTAG

Protein sequence

MTRFKAQLQQ IVLAFKEINP NAKKILFFEP VFTIPYAMFI IYSSLYMTRV GVKDYQIGLL 
STVLNLVMLI TSPFAGMLVN RFGRKKVLLI GDFLSWCVYA YIFFFAKDFA WFLIATIFNG 
LMRIPELAWR LLLMEDATEN ERVAIYSVTV FVWNMGNLFA PVMGVLVARF GLIPATKWTV 
LAFGILVNIL IVVRHLVTSE SSVGQKLVQE NSDKNNNGFS EWFDSLKYMF RNGQLLLIVL 
VTIFGNVALI FRDTYKNIYL SEALHYPDSI ISVFPTLWSA VALIFVIFLI PNLKEQKHDT 
VLFWGMFSIT VSNALILVAP PGTFGFILMI IVTVLGSIGA AVYYSFVDAI LANSVDDERR 
AHVLSITMFL ISLFSMPVGA IAGQCYTFSK SLPFVLATIF TLLCTILIFF KIRIRRAQKE 
K