Gene Athe_1067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1067
Symbol
ID	7409624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1162590
End bp	1163861
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	33%
IMG OID	643715433
Product	major facilitator superfamily MFS_1
Protein accession	YP_002572941
Protein GI	222529059
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0207259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACATCTG AAGACCAAGA ACGGGAATTT AAAAGACTTG AGGTTTTTGC CTATAAAAAT 
TTAAAGAAAA ATTCTATCAT TTCGATTGCA GATGGAGCAG TATTTGCAAT AGGAAGCGGT 
ATGCTTCCAG TTTCTACTGT GATAGTTTAT TTTATTTCAC ATTATGTTCA CTCAAATACG 
CTGATTGGAC TTTTAACCAC CTTGAATGTA CTTTTATCTA ACTCTCCGCA GATTCTTGTT 
GCTAAAAAAT TAGAGATGCT TGATAGCTAC AAAGAGTATT TTATTAAAGT TGCCTTACTT 
ATGAGACTTA TGTGGTTTTT ACTGGCAATT GATGTGTTTG TGTTTGCAAC CACAAATGAG 
CTTTTATTTG TAATTCTCTT TTACCTAATT TTTAGTCTTC AAGGTTTTTT TGCTTCATTT 
GCCAATATAA CATGGTTCAA TCTTATTCTA AAGCTTGTTC CTGAAAGACA AAGGAGCAAG 
TTTTTTGGTA TAAGGTCTTC GATAGGGGGA CTGTGTGAGA CATTTGGAGC CTTTTTGATG 
GGAAGAATAT TGAGGCTTTT ACACTTTCCT TATAACTATG GTCTTTTATT TTTAATTTCG 
TTTTTGATAA TGATGCTCTC ATTGTACATA GCTTCTATGA TGAAAGAGAT TCCTATCAAG 
AAACCCAAAA AGGTGATTGA TAATAAGCAT TATTTTAGGA GCATGTTTTT GATACTGAAA 
GAAGATAGAA ATTTTAAATA TTATCTTCTT TCAGTTTTAT TTATTGGCGC ACTGGGTAAG 
ATGCCATTTG GTTTTCAAAC CATATTTGCA AAAAATAGCC TGAGTATTTC AACACAACAT 
GTTGCAATTG CAACCACAAT ATTGCTTTTT TCTCAGACAA TAGGATATAT GCTATGGGGA 
ATAATCGGTT CTAAGTATGG GTTTAAAAGT ACTCTTTTGA TTTCTGCTTT GATGTTTTTA 
CCTGCAATAT ATTTTACATA CCTTATGAGT TCTATAAGCG TTTATTATCT TTCTGTTGCT 
CTGTTTGGGA TTGCTCAAAG TGCAAGGAAC GTAAACGAAA GCAATATGGC TGCAAAACTT 
TGCAAGGACC CTTTAAAGCA GCCATCTTAT ATTGGTCTTA GAAATTTTTT GATGGGACCA 
TTTTTTGCTT TTAATTCTAT AATAGCTGGA GGTATAATTG ATACTCTTGG TAAAAACATT 
CTCTTTTTAA TTTCATTTAG CTGCATGGTG CTCGGATTTT TTATTCTGTG TTTTTTAGTC 
AGAGAGGACT AA

Protein sequence

MTSEDQEREF KRLEVFAYKN LKKNSIISIA DGAVFAIGSG MLPVSTVIVY FISHYVHSNT 
LIGLLTTLNV LLSNSPQILV AKKLEMLDSY KEYFIKVALL MRLMWFLLAI DVFVFATTNE 
LLFVILFYLI FSLQGFFASF ANITWFNLIL KLVPERQRSK FFGIRSSIGG LCETFGAFLM 
GRILRLLHFP YNYGLLFLIS FLIMMLSLYI ASMMKEIPIK KPKKVIDNKH YFRSMFLILK 
EDRNFKYYLL SVLFIGALGK MPFGFQTIFA KNSLSISTQH VAIATTILLF SQTIGYMLWG 
IIGSKYGFKS TLLISALMFL PAIYFTYLMS SISVYYLSVA LFGIAQSARN VNESNMAAKL 
CKDPLKQPSY IGLRNFLMGP FFAFNSIIAG GIIDTLGKNI LFLISFSCMV LGFFILCFLV 
RED