Gene Ent638_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1544
Symbol
ID	5114512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	1699852
End bp	1701036
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	49%
IMG OID	640491731
Product	Na+ dependent nucleoside transporter
Protein accession	YP_001176274
Protein GI	146311200
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.13082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATAACT TTGTCCATTT CCTGCTGGCG CTGGTGATTA TTCTTGCGCT CGCCTGGCTG 
GTGAGTTTCG ACCGCCGAAA AATTCGTATT CGCTACGTTT TACAGCTTAT TGTCATTGAA 
ATTGCGCTAG CTTTCTTTTT CCTGCACGCG GAAAGCGGAC TCTTCGTGAT TAAATATGTC 
TCCGGATTCT TTGAATCCCT GCTGAAATTC GCAGCAGAAG GAACAAACTT TGTCTTTGGT 
GGGATGGGTG AAAAAGGACT GGCGTTCATT TTCCTCGGCG TTCTGTGCCC GATTATTTTC 
ATCTCTGCGC TGATTGGTAT TCTCCAGCAT TGGCGAATTC TGCCGATTTT TATTCGCGTT 
ATCGGCACGC TGCTGTCCAA ACTGAACGGC ATGGGAAAAC TGGAATCGTT TAACGCCGTC 
AGCTCCCTGA TTTTGGGTCA GTCGGAAAAC TTTATTGCGT ATAAAGGTGT GCTGGGCGAT 
CTCTCCTCTC GCCGCCTGTT CACCATGTCT GCTACCGCGA TGTCGACCGT TTCGCTGTCG 
ATTGTCGGCG CATATATGAC CATGCTCGAT GCCAAATTTG TGGTCGCTGC GTTAATTCTG 
AATATGTTCA GCACCTTTAT TATTTTGTCG GTCATTAACC CGGCGCGACC AGAAGCCGAA 
CCCGAAATCA AACTGGAAAA ACTGCATGAA TCTCAGAGTT TCTTTGAGAT GCTTGGCGAG 
TATATTCTGG CTGGTTTTAA AGTGGCGATG ATTATTATGG CGATGCTGAT CGGCTTTATT 
GCCATTATTA GCGCCATCAA CGCTCTTTTC TCCAGCGTAT TTGGCATAAG TTTCCAGCAA 
ATTCTCGGCT ACGTATTTTA TCCGCTAGCA TGGCTGGTGG GCATTCCGCT GAGCGATGCG 
TTAAATGCGG GCAGTATTAT GGCGACGAAA CTGGTGGCGA ATGAATTTGT GGCGATGATT 
GAGCTGCAAA AAATAGCCGG TCAAATGACG CCGCGCGGCC TGGGCATTCT GTCGGTCTTC 
CTGGTCTCCT TTGCCAACTT TGCGTCCATC GGGATTATCG CGGGTGCGAT TAAAGGCCTG 
AATGAGCAGC AAGGAAACGT GGTTTCTCGC TTTGGTTTGC GTCTGGTCTA CGGCGCGACG 
CTGGTGAGCC TGCTGTCGGC AAGCTTCGCC GGATTAGTAT TGTAA

Protein sequence

MYNFVHFLLA LVIILALAWL VSFDRRKIRI RYVLQLIVIE IALAFFFLHA ESGLFVIKYV 
SGFFESLLKF AAEGTNFVFG GMGEKGLAFI FLGVLCPIIF ISALIGILQH WRILPIFIRV 
IGTLLSKLNG MGKLESFNAV SSLILGQSEN FIAYKGVLGD LSSRRLFTMS ATAMSTVSLS 
IVGAYMTMLD AKFVVAALIL NMFSTFIILS VINPARPEAE PEIKLEKLHE SQSFFEMLGE 
YILAGFKVAM IIMAMLIGFI AIISAINALF SSVFGISFQQ ILGYVFYPLA WLVGIPLSDA 
LNAGSIMATK LVANEFVAMI ELQKIAGQMT PRGLGILSVF LVSFANFASI GIIAGAIKGL 
NEQQGNVVSR FGLRLVYGAT LVSLLSASFA GLVL