Gene Suden_2077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Suden_2077
Symbol
ID	3763088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfurimonas denitrificans DSM 1251
Kingdom	Bacteria
Replicon accession	NC_007575
Strand	-
Start bp	2165699
End bp	2166979
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	39%
IMG OID
Product	glucose/galactose transporter
Protein accession	YP_394586
Protein GI	78778271
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCTA AAAGTTCATT CATTCCTATG TTTATCATGG GCACTCTCTT CTTTATCTTT 
GGTTTTGTAA CATGGTTAAA TGGCTCTTTA ATCCCATTTT TAAAAATAGT ATGTGAGCTC 
AATGAGTTTG AAGCACTGTT TGTAACCTTT GCTTTTTATA TCTCATATAC TGTTATGGCT 
CTTCCTATGG CGTATGTTTT GGAAAAAACT GGCTACAAAG ATGGTATGGC TTTAGGACTT 
GGAGTGATGG CTATCGGCGC ACTTCTTTTT ATACCAGCAG CACAAAGTGC TGAGTTTATT 
ATCTTCTTGA TTGCACTCTT TACATTAGGA ACAGGACTTA CAATCCTTCA AAGCGCTTCA 
AATCCATATA TCGTTTATCT GGGTCCAGTA GAGAGTGCGG CTATGCGAAT AAGCATAATG 
GGAATCATAA ACAAAGGTGC TGGAGTTTTG GCACCTATCG TATTTAGCGC TTTGCTCTTT 
TTGGATGTTG GTGAACAAGA TGTGATGAGC GAAGCCTCAA GGGAGATACT TGCTCAAAAA 
CTTATAGTTC CATATATTGT TATGGCGCTT ATATTGGTAG CGCTTATCGT TCTTATCAAG 
TTCTCATCAC TAGAGAGTCT CACAATAAAA GATGATAAAT CAAATAGTGA AAAAAGCTCT 
ATATTTGAAT TTCCACGCCT TATCTTAGGC GCAATTGCCC TCTTTTTTTA TGTCGGCATA 
GAAGTCATTG CGGGAGATAC AATAGCTCTT TATGCGCAAA GTATTGGAGT TGAGAGTTAT 
AGCACTCTTA CCTCTTTTAC CATGTTTTTT ATGGTGCTTG GATATATAGC TGGAATTGTT 
TTTATACCTA GATATCTCTC ACAAAAAAAC GCACTTATAG GCTCTGCACT CTTTGGTATT 
TTGTTTTTAC TCGGTGTTGT ATTTTCCTTA TCAACCTCTC ATCTCTTATC TGAGATTTTA 
TGGGGATGGA GTGGTGTTAG AACTCTTCCA GATACTATAA CATTTGTTGC ACTTTTAGGT 
TTTGCAAATG CTCTCGTATG GCCGAGTATC TGGCCATTAG CGCTTAATGG GCTTGGCAAA 
CATACCCCAA AAGGGAGCGC ACTGCTTATT ATGTCAATAG CGGGAGGAGC GCTTCTTCCG 
CTTCTTTTTG GCAAAATTGC TCAGCTGGTC TCAAGCATGC AAACAGCATA TCTCCTTGGC 
ATAGTCTCTT ATGCCTTTAT ACTTTATTAC GCTGTCGCAG GGCACAAAAT TTCATCTTGG 
AAAAACAGTG ATAAGAGTTA G

Protein sequence

MPAKSSFIPM FIMGTLFFIF GFVTWLNGSL IPFLKIVCEL NEFEALFVTF AFYISYTVMA 
LPMAYVLEKT GYKDGMALGL GVMAIGALLF IPAAQSAEFI IFLIALFTLG TGLTILQSAS 
NPYIVYLGPV ESAAMRISIM GIINKGAGVL APIVFSALLF LDVGEQDVMS EASREILAQK 
LIVPYIVMAL ILVALIVLIK FSSLESLTIK DDKSNSEKSS IFEFPRLILG AIALFFYVGI 
EVIAGDTIAL YAQSIGVESY STLTSFTMFF MVLGYIAGIV FIPRYLSQKN ALIGSALFGI 
LFLLGVVFSL STSHLLSEIL WGWSGVRTLP DTITFVALLG FANALVWPSI WPLALNGLGK 
HTPKGSALLI MSIAGGALLP LLFGKIAQLV SSMQTAYLLG IVSYAFILYY AVAGHKISSW 
KNSDKS