Gene Nther_2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2073
Symbol
ID	6316057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	2193043
End bp	2194335
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	40%
IMG OID	642644461
Product	major facilitator superfamily MFS_1
Protein accession	YP_001918228
Protein GI	188586683
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.521626
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACAAA ATGTTAAAAA ATCTTACGGA CATCGGGTAG TTATGTCTGC TTGGTTGGCA 
GTTTTCGTCT TATTTGGATA TCGTGCGACC TTTTCTGTAT TACAAGGCCC TATGGCCGAA 
AGCACAGGAT GGACTTCTGG AGAACTGTCT CTGGGGTATT CTTTGATGAT GAGTATTTAT 
GCTATTACAG CCTTCCTCAG CGGATACATC ATTGACAGAT GGGGCACTCG ACCAGCGTAT 
ATTATTGGAG CCATTTTTGC ATGTTTAGGA TTTTTGGTAA CTAGTACTGT AGATTCTTAT 
ATACAGTATC TAGCCAGCTA CTCAATTTTT GCCGGAATCG GTACTGGTAT GCTATGGGTG 
TCTTCAACAA TTTCTGTCAG AAAATGGTAT GTAGGTAAAT CTTATGCTAC TATGTGGGGA 
ATTGCTTTCA CAGGGGCTCC AGCTGCCCAA GTACTTTTAA GCTTGGGAAT AGATGGTGTC 
ATAGAGGATA TGGGATGGAG GTTGGCAATG CAGCTTTTAG CCATAATAGT TCTAATTGCA 
TTACTCGTTG CAGGGATATT AGCCAAAAAA AATCCCGAAG ACTACAATAT GGTACCCTTC 
GGTTCTAATG AAAAAAATAC CTCTTCAAAG GATCATCACA AAAATGCCGA TACATCTAGA 
ATTTGGAGTG TTAAGGAAGC TTTTGTAACT CCAGCCATTT GGGTAGTTAT AATTGCCTTT 
TTATCTGCCA TGATAGGTGA ATTCTTAATT TGGACTCAGG TAGTGAATTA TTTTATCATT 
GACGCAAATC TTTCCCAAAC TACCGCTACT AATTTATATG TAGTTATTGG GTTAGCTGGG 
TTAGTAACCA TGCCCCTCAT GGGAATAATT GCAGATAAAG TGGTTTCAAT GGTAGGTGAT 
GAAACAAAGG GAAGGAAATA TATGTTAGTT TTTGCTCCTG CAGTAGGTAT AGTAGCCTGT 
TTGTTATTAT TACTTACCGA TCAAGCCATT GTATTGGGAG GCACAGCATC AGTTTTATTT 
GCTATCTATT GGGCGATTGA GCCAGGTGGG GCAGCAGGAT ATGCAGGAGC AGTTTACGGT 
CAAATATCGT TAGGGAAAAT TTGGGGATTA TCCACCTTAA TAGTAATGGG AATCGGGCCA 
GCTTTGGGAA GCTTCATGGG AGGTTTTCTA TATGACTTAA CAGGAAGTTA TAATAATTCC 
ATTTTATTTG CAATGGGAGC CTTCACATTG TCTACAATTG CAGCTTGCTT GCTACCACTG 
AAAATATCAT CGAATTCAGA TCATCCTAAA TAA

Protein sequence

MEQNVKKSYG HRVVMSAWLA VFVLFGYRAT FSVLQGPMAE STGWTSGELS LGYSLMMSIY 
AITAFLSGYI IDRWGTRPAY IIGAIFACLG FLVTSTVDSY IQYLASYSIF AGIGTGMLWV 
SSTISVRKWY VGKSYATMWG IAFTGAPAAQ VLLSLGIDGV IEDMGWRLAM QLLAIIVLIA 
LLVAGILAKK NPEDYNMVPF GSNEKNTSSK DHHKNADTSR IWSVKEAFVT PAIWVVIIAF 
LSAMIGEFLI WTQVVNYFII DANLSQTTAT NLYVVIGLAG LVTMPLMGII ADKVVSMVGD 
ETKGRKYMLV FAPAVGIVAC LLLLLTDQAI VLGGTASVLF AIYWAIEPGG AAGYAGAVYG 
QISLGKIWGL STLIVMGIGP ALGSFMGGFL YDLTGSYNNS ILFAMGAFTL STIAACLLPL 
KISSNSDHPK