Gene Ent638_4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4053
Symbol
ID	5110807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4406607
End bp	4407911
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	59%
IMG OID	640494278
Product	sodium/sulphate symporter
Protein accession	YP_001178759
Protein GI	146313685
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCT GGTTTACTCA CCCTCTTTTT CTGCCCTCGC TCATTGTTGG CATCACCATC 
GTGCTGTGGG CGACCTCGCT CCTGCCGGAA TTTATCACCG CGCTGCTGTT CTTTACGGCA 
GCGATGATCG CCAAAATTGC CCCTGCGGAT GTCATTTTCG GAGGCTTTGC ATCATCGGCA 
TTCTGGCTGG TCTTCAGCGG ATTTGTGCTC GGTGTGGCGA TTCGCAAAAC CGGCCTGGCG 
GACAGGGCGG CGCGAGCGCT ATCGGCAAAA CTGACCGATT CGTGGCTGTT GATGGTGGCA 
ACTGTGGTGC TGCTGAGTTA TGCCCTGGCG TTTGTGATGC CGTCGAACAT GGGGCGCATC 
GCGCTGCTGA TGCCGATTGT GGCTGCGATG GCTAAACGCG CCAGCATCGC GGACGGCTCC 
CGTGCGTGGT TTGGTCTGGC GCTGGCGGTG GGTTTCGGGA CGTTCCAGCT TTCCGCGACT 
ATTTTGCCCG CTAATGTGCC CAATCTGGTG ATGAGTGGCG CGGCGGAAGG TTCATACGGC 
ATCCATCTGA ACTACGTGCC TTATCTCCTG CTGCACACGC CGGTGCTCGG CATTCTGAAA 
GGACTGATTC TGATTGGGCT GATCTGCTGG CTGTTCCCCG GCTCACCGAA ACATCCGCAG 
GAGGTTTCTG CGCCGGAACC GATGGGACGC GATGAGAAAC GGCTCGCCTG GCTTTTGGCG 
GTAGTGCTGG TGATGTGGGT GACGGAGAGT TGGCACGGAA TTGGCCCCGC GTGGACCGGG 
CTGGCGGCAT CGCTGGTGGT GATGCTCCCG CGCATCGGCT TTATTACTGG CGAGGAGTTT 
TCAGCGGGCG TGAATATGCG CACCTGTATC TACGTGGCGG GTATTTTGGG GCTGGCTATC 
ACCGTCACGC AGACGGGAAT TGGGAGCGCC GTAGGAGAGG CGCTGCTTCA CCTGATGCCG 
CTGGACGCGG ATAAGCCTTT CACCAGTTTC CTGGCGCTCA CGGGGATCAC CACGGCGCTT 
AACTTCATCA TGACCGCCAA CGGCGTTCCG GCGCTGTACA CCACGCTGGC GCAGAGTTTT 
TCCGACGCGA CCGGTTTCCC GCTGCTGTCG GTGATTATGA TTCAGGTGTT GGGTTATTCC 
ACGCCGCTGT TGCCGTATCA GGCGTCGCCG ATTGTGGTAG CGATGGGACT TGGGAAAGTG 
CCTGCAAAGG CGGGAATGAT GCTGTGTCTG GCGCTGGCAG TGGCGACCTA TGTGGTCCTG 
TTGCCGCTCG ATTACTTATG GTTTAGCGTG CTGGGGAAAT TATAG

Protein sequence

MSLWFTHPLF LPSLIVGITI VLWATSLLPE FITALLFFTA AMIAKIAPAD VIFGGFASSA 
FWLVFSGFVL GVAIRKTGLA DRAARALSAK LTDSWLLMVA TVVLLSYALA FVMPSNMGRI 
ALLMPIVAAM AKRASIADGS RAWFGLALAV GFGTFQLSAT ILPANVPNLV MSGAAEGSYG 
IHLNYVPYLL LHTPVLGILK GLILIGLICW LFPGSPKHPQ EVSAPEPMGR DEKRLAWLLA 
VVLVMWVTES WHGIGPAWTG LAASLVVMLP RIGFITGEEF SAGVNMRTCI YVAGILGLAI 
TVTQTGIGSA VGEALLHLMP LDADKPFTSF LALTGITTAL NFIMTANGVP ALYTTLAQSF 
SDATGFPLLS VIMIQVLGYS TPLLPYQASP IVVAMGLGKV PAKAGMMLCL ALAVATYVVL 
LPLDYLWFSV LGKL