Gene Ent638_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3157
Symbol
ID	5111710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3437129
End bp	3438331
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	640493356
Product	glycine betaine transporter ATP-binding subunit
Protein accession	YP_001177872
Protein GI	146312798
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0735792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTA AATTAGAAGT TAAAAATCTG TATAAAGTAT TTGGCGATAA TCCGCAGCGA 
GCCTTCAAAT ATATTGAAAA AGGACTTTCA AAAGAATTAA TCCTGGAGAA AACAGGGCTT 
TCGCTTGGCG TTAAAGACGC CAGTCTGGCC ATTGAAGAAG GCGAGATTTT CGTCATCATG 
GGATTATCCG GTTCGGGTAA ATCCACCATG GTACGCCTTC TCAATCGCCT GATTGAACCC 
ACTCGTGGAC AGGTGCTGAT TGACGGCGTG GATATCGCAA AAATATCCGA TGCTGAGCTG 
CGCGAAGTGC GCAGGAAAAA GATTGCAATG GTCTTCCAGT CATTCGCGCT AATGCCACAT 
ATGACGGTAT TGGATAATAC CGCCTTCGGT ATGGAATTAG CGGGAATCCC TGCGGCTGAG 
CGCCAGGAAA AAGCGCTGGA TGCATTGCGT CAGGTTGGAC TTGAAAATTA CGCTCACGGT 
TATCCGGATG AACTCTCGGG CGGTATGCGC CAGCGTGTGG GTTTGGCCCG CGCATTAGCG 
ATTAACCCCG ATATCTTATT AATGGATGAA GCCTTCTCGG CGCTCGATCC TTTAATTCGT 
ACCGAGATGC AGGATGAACT GGTAAAACTT CAGGCAAAAC ATCAGCGCAC CGTGGTGTTT 
ATTTCCCACG ATCTGGATGA AGCCATGCGA ATTGGCGACC GTATTGCCAT TATGCAAAAT 
GGCGAAGTGG TTCAGGTCGG CACCCCGGAC GAAATTCTGA ATAATCCGGC AAATGATTAT 
GTGCGGACCT TCTTCCGTGG CGTAGATATT AGCCAGGTCT TTAGCGCCAA AGATATTGCC 
CGTCGCGCGC TGAACGGCAT TATTCGTCGT ACGCCTGGTT TTGGCCCGCG ATCGGCGTTG 
AAGCTGCTAC AGGATGAAGA CCGCGAATAC GGCTATGTGA TTGAACGCGG TAATAAATAT 
GTTGGCATTG TCTCCATTGA TTCACTGAAA AGCGCGTTAA GCGAAAATCT GGGAATCGAT 
GCGGCGTTAA TTGACGCTCC ACTTGCCGTG GACGCCGAAA CACCGCTCAG CGAGTTGCTC 
TCTCATGTGG GTCAGGCGCC GTGCGCCGTA CCGGTTATCG GAGAAGAACA ACAATACGTC 
GGCATCATCT CAAAACGGAT GTTGCTGCAG GCTTTAGATC GCGAGGGGGC AAACAATGGC 
TGA

Protein sequence

MAIKLEVKNL YKVFGDNPQR AFKYIEKGLS KELILEKTGL SLGVKDASLA IEEGEIFVIM 
GLSGSGKSTM VRLLNRLIEP TRGQVLIDGV DIAKISDAEL REVRRKKIAM VFQSFALMPH 
MTVLDNTAFG MELAGIPAAE RQEKALDALR QVGLENYAHG YPDELSGGMR QRVGLARALA 
INPDILLMDE AFSALDPLIR TEMQDELVKL QAKHQRTVVF ISHDLDEAMR IGDRIAIMQN 
GEVVQVGTPD EILNNPANDY VRTFFRGVDI SQVFSAKDIA RRALNGIIRR TPGFGPRSAL 
KLLQDEDREY GYVIERGNKY VGIVSIDSLK SALSENLGID AALIDAPLAV DAETPLSELL 
SHVGQAPCAV PVIGEEQQYV GIISKRMLLQ ALDREGANNG