Gene Ent638_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3159
Symbol	proX
ID	5111712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3439581
End bp	3440576
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	53%
IMG OID	640493358
Product	glycine betaine transporter periplasmic subunit
Protein accession	YP_001177874
Protein GI	146312800
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.138504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACATA ACGTACTTTT TGCCACAGCG TTTGCCACCC TTGTCTCAAC CAGCACATTT 
GCGGCTGATC TCCCGGGCAA AGGCATTACC GTTCAACCGG TTCAGAGCAC CATTTCCGAA 
GAGACGTTCC AGACCATGAT CGTCAGCCGT GCGCTGGAAA AACTGGGCTA TACGGTCAAT 
AAGCCAAGTG AAGTGGATTA CAACGTGGGC TATACCTCGA TCGCCTCTGG CGACGCCACG 
TTCACCGCCG TTAACTGGAA GCCGCTGCAT GATGATATGT ACGCTGCTGC GGGCGGGAGT 
AAAAAATTCT ATCGCGAAGG AACATTTGTG ACCGGTGCGG CGCAGGGCTA TCTGATCGAC 
AAGAAAACCG CCGAGAAATA CCACATCACC AATATCGAGC AGTTGAAAGA TCCGAAGATC 
GCCAAACTGT TCGACACCAA CGGTGACGGT AAAGCCGACA TGATGGGCTG CTCCCCAGGC 
TGGGGTTGTG AAGCGGTGAT TAACCATCAG AACAAAGCGT TCGATCTTGA GAAGACCGTT 
GACGTGAGCC ACGGGAATTA CTCGGCGATG ATGGCGGATA CTATCGCGCG CTTTAAAGAA 
GGCAAACCAG TTATCTATTA CACCTGGACT CCATACTGGG TGAGCGATGT GTTGAAGCCG 
GGTAAAGATG TAGTGTGGCT GCAGGTGCCG TTCTCCTCTC TGCCAGGCGA ACAGAAAGAT 
ATCGACACCA AGCTGCCGAA CGGCATGAAC TATGGCTTCC CGGTGAATAC GATGCATATC 
GTGGCGAACA AAGCCTGGGC AGAGAAAAAC CCGGCGGCGG CGAAACTGTT CTCCGTGATG 
AAACTGCCCC TGGCGGATAT CAACGCGCAG AACGCGATGA TGCATGAAGG CAAATCGTCC 
GATGCAAATA TTCAGGGTCA CGTTGACGGC TGGATCAAAG CCCACCAGCA GCAGTTTGAT 
GGCTGGGTGA AAGAGGCGCT GGCCGCACAG AAATAG

Protein sequence

MRHNVLFATA FATLVSTSTF AADLPGKGIT VQPVQSTISE ETFQTMIVSR ALEKLGYTVN 
KPSEVDYNVG YTSIASGDAT FTAVNWKPLH DDMYAAAGGS KKFYREGTFV TGAAQGYLID 
KKTAEKYHIT NIEQLKDPKI AKLFDTNGDG KADMMGCSPG WGCEAVINHQ NKAFDLEKTV 
DVSHGNYSAM MADTIARFKE GKPVIYYTWT PYWVSDVLKP GKDVVWLQVP FSSLPGEQKD 
IDTKLPNGMN YGFPVNTMHI VANKAWAEKN PAAAKLFSVM KLPLADINAQ NAMMHEGKSS 
DANIQGHVDG WIKAHQQQFD GWVKEALAAQ K