Gene Ent638_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1455
Symbol
ID	5114420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	1608672
End bp	1609634
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	53%
IMG OID	640491641
Product	alkanesulfonate transporter substrate-binding subunit
Protein accession	YP_001176186
Protein GI	146311112
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0687578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAT ACCTCTTTCG TCTTGGGCTA ACGAGTTTGC TGGCCGTCTC CGCTCTGGCT 
CATGCGGCAA ACTCTGCGCC AGAAAGTTTA CGTATCGGCT ACCAGAAAGG CAGCATCAGC 
ATGGTGCTGG CAAAGAGTCA TCAGCTGCTG GAAAAACGTT ATCCGCAGAC CCAGTTTTCG 
TGGATTGAAT TCCCGGCTGG CCCGCAAATG CTCGAAGCAC TCAATGTGGG CAGCATTGAT 
ATAGGCAGTA CGGGCGATAT ACCGCCGATA TTCGCCCAAG CCGCGGGTGC AGATTTGGTC 
TACGTCGGCG TCGAACCCGC TAAGCCTAAA GCCGAAGTCA TTCTGGTGCC TGAAAACAGT 
CCGATTAAGA CCGTCGCGGA TCTTAAAGGC CATAAAGTTG CGTTCCAGAA AGGTTCCAGT 
TCGCACAACC TGCTGCTCCG TGCACTGCAG CAGGCAGGCC TGACGTTCAA GGATATTCAG 
CCGATCTACT TAAGCCCGGC CGATGCGCGC GCTGCTTTCC AGCAAAATAA CGTGGATGCC 
TGGGCCATTT GGGATCCTTA CTATTCTGCA GCTCTGCTGC AGGGTGGCGT TCGCGTTCTG 
AAAGATGGCG AAACGCTTAA ACAGACCGGT TCGTTCTATC TTGCGGCGCG ACCTTATGCC 
GAAAAGAACG GTGAATTTGT TCAAGGTGTG CTGAATACCT TCAGTGAAGC GGATGCGCTC 
ACCCAAAGCC AGCGTCAGGA GAGTATCACC CTGCTGGCAA AAACCATGGG CCTGCCCGAA 
CCGGTGATCG CCAGCTATCT GGATCATCGG CCAACCACCG TGATCAAACC AGTTGATGCC 
CACACGGCGG TATTACAGCA ACAAACCGCG GATCTGTTTT ATGAAAACCG TCTGCTCCCG 
AAAAAGATCG ATATTCGCGA CCGTATCTGG CAACCCGCTG GCAAAGAAGG ATCGAAATCA 
TGA

Protein sequence

MFKYLFRLGL TSLLAVSALA HAANSAPESL RIGYQKGSIS MVLAKSHQLL EKRYPQTQFS 
WIEFPAGPQM LEALNVGSID IGSTGDIPPI FAQAAGADLV YVGVEPAKPK AEVILVPENS 
PIKTVADLKG HKVAFQKGSS SHNLLLRALQ QAGLTFKDIQ PIYLSPADAR AAFQQNNVDA 
WAIWDPYYSA ALLQGGVRVL KDGETLKQTG SFYLAARPYA EKNGEFVQGV LNTFSEADAL 
TQSQRQESIT LLAKTMGLPE PVIASYLDHR PTTVIKPVDA HTAVLQQQTA DLFYENRLLP 
KKIDIRDRIW QPAGKEGSKS