Gene Ent638_3660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3660
Symbol
ID	5111908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3968202
End bp	3969689
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	58%
IMG OID	640493865
Product	putative sialic acid transporter
Protein accession	YP_001178368
Protein GI	146313294
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00891] putative sialic acid transporter

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.723795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.17962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTC CTACCCAAAG CATCCCGTGG TACCGCCATC TCAGCCGCCC GCAGTGGCGC 
GCCTTCTCCG CCGCATGGTT GGGATATCTG CTGGATGGTT TCGATTTTGT ATTGATAGCG 
CTGGTGTTAA CGGAAGTTAA AACGGAATTT GGACTGACAA CGGTCGAGGC GGCTAGCCTC 
ATATCCGCTG CCTTTATCTC CCGATGGTTT GGCGGCCTGC TGCTTGGCGC TATGGGCGAT 
CGCTACGGGC GGAAACTGGC GATGATCACC AGTATCGTGC TGTTTTCGTG CGGGACGCTG 
GCGTGCGGTT TTGCGCCAGG CTACATCACG ATGTTTATTG CCCGCATGGT GATCGGCATG 
GGCATGGCGG GCGAATACGG CTCCAGCGCC ACCTACGTGA TTGAAAGCTG GCCAAAGCAC 
CTGCGCAACA AAGCCAGCGG CTTTTTGATC TCCGGCTTCT CTGTGGGTGC CGTTATCGCG 
GCGCAGATCT ACAGCCTCGT CGTTCCCGTC TGGGGCTGGC GCGCGCTGTT TTTTATCGGC 
ATCCTGCCGA TCATTTTTGC CCTGTGGCTG CGTAAAAATA TTCCGGAAGC GGAAGACTGG 
AAAGCCAGAC ACGAAGGTAA AGCGCCCGTG CGCACAATGG TGGATATTCT CTATCGTGGC 
AAACATCGGG TGATCAATAT CGCTATGACG CTCTTCGCGG GAACGGCGCT GTGGTTCTGC 
TTTGCTGGGG AACTCAACAA TGCCGGTCTG GTGATGATTC TTGGCCTGCT GTGCGCCTTT 
GTGTTCATCA GCTTTATGGT GCAAAGCAGC GGTAAGCGCT GGCCGACGGG CGTCACTCTG 
ATGGTGGTCG TGCTGTTTGC GTTCCTTTAT TCGTGGCCGA TTCAGGCGCT GCTGCCGACC 
TATCTGAAAA CGGATTTGGC GTACGATCCG GCGATGGTGG CGCGCGTGCT GTTCTTCAGC 
GGCTTTGGCG CAGCGGTTGG CTGCTGTGTC GGCGGTTTTC TGGGCGACTG GCTGGGGACG 
CGCAAAGCGT ACGTTTGCAG CCTGCTGGCC TCGCAGCTCC TTATCATTCC GGTCTTTGCG 
ATTGGCGGGT CCAATATCTG GGTTCTCGGT TTTCTGCTCT TCTTCCAGCA GATGCTCGGG 
CAGGGGATTT CCGGAATTCT GCCGAAGCTT ATCGGCGGCT ACTTCGATAC CGATCAGCGT 
GCCGCCGGGC TGGGCTTTAC TTACAACGTC GGCGCATTGG GTGGGGCGAT TGCGCCGGTG 
ATTGGGGCGC TGCTGGCACA ACGTCTGGAG CTGGGCACCG CGCTCGGTTC ACTCTCGTTC 
GGCTTAACCT TTGTCGTCAT CCTGTTGATT GGCCTGGATA TGCCGTCTCG CGTGCAGCGC 
TGGATCCGCC CCGAGGCACT TCGCACGCAC GATGCGATTG ACGGTAAACC GTTCAGCGGG 
GCCGTTCCTC TAGGCAGCAT CAAAAGCGAG CGTGAGGCGG TGAAATGA

Protein sequence

MRIPTQSIPW YRHLSRPQWR AFSAAWLGYL LDGFDFVLIA LVLTEVKTEF GLTTVEAASL 
ISAAFISRWF GGLLLGAMGD RYGRKLAMIT SIVLFSCGTL ACGFAPGYIT MFIARMVIGM 
GMAGEYGSSA TYVIESWPKH LRNKASGFLI SGFSVGAVIA AQIYSLVVPV WGWRALFFIG 
ILPIIFALWL RKNIPEAEDW KARHEGKAPV RTMVDILYRG KHRVINIAMT LFAGTALWFC 
FAGELNNAGL VMILGLLCAF VFISFMVQSS GKRWPTGVTL MVVVLFAFLY SWPIQALLPT 
YLKTDLAYDP AMVARVLFFS GFGAAVGCCV GGFLGDWLGT RKAYVCSLLA SQLLIIPVFA 
IGGSNIWVLG FLLFFQQMLG QGISGILPKL IGGYFDTDQR AAGLGFTYNV GALGGAIAPV 
IGALLAQRLE LGTALGSLSF GLTFVVILLI GLDMPSRVQR WIRPEALRTH DAIDGKPFSG 
AVPLGSIKSE REAVK