Gene Ent638_3707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3707
Symbol
ID	5112265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	4019441
End bp	4020466
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	51%
IMG OID	640493912
Product	extracellular solute-binding protein
Protein accession	YP_001178415
Protein GI	146313341
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.371845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA CGATGATAGC CAGCCTGGCC GCCGCCGGCA TGTTGTTTGC TGTAGCGGGT 
CAGGCGCATG CAGGCGCAAC TCTGGATGCC GTTAAAAAGA AAGGCTTTGT ACAGTGCGGT 
ATCAGCGATG GGTTACCGGG TTTCTCCTAC GCGGATGCTA ACGGGAAATT CTCCGGGATC 
GACGTTGACG TGTGCCGAGG CGTTGCAGCG GCTCTCTTCG GTGATGATAC CAAAGTAAAA 
TACACCCCAC TCACAGCGAA AGAACGTTTC ACCGCTTTGC AATCTGGCGA AGTTGATGTG 
CTCTCGCGTA ATACCACCTG GACCTCGTCT CGTGATGCTG GCATGGGCAT GACGTTTACT 
GGCGTCACCT ATTATGACGG TATCGGTTTC CTGACTCACA ATAAAGCAGG CCTGAAGAGT 
GCGAAAGAAC TCGACGGTGC GACTGTCTGT ATTCAGGCCG GTACGGATAC CGAGTTGAAC 
GTCGCGGATT ATTTCAAAGC GAATAAGATG AAATACACCC CAGTGACGTT TGATCGCTCT 
GATGAATCCG CAAAAGCTCT GGAATCAGGC CGTTGCGATA CGCTGGCCTC TGACCAGTCT 
CAGCTGTATG CCCTTCGCAT TAAGCTCAGT AATCCTGCGG AGTGGATTGT TCTGCCTGAA 
GTTATCTCAA AAGAACCTCT TGGCCCAGTC GTTCGTCGCG GTGATGAAGA GTGGACCTCG 
ATTGTTAAGT GGACTCTCTT CGCCATGCTG AATGCTGAAG AAATGGGAAT TAACTCGAAG 
AACGTTGATG AGAAAGCAGC AGCTCCATCC ACTCCGGATA TGGCACATCT TCTGGGTAAA 
GAAGGTGACT ACGGCAAGGA TCTTAAGCTC GATAATAAAT GGGCTTACAA CATCATTAAA 
CACGTTGGCA ACTACGGAGA GATCTTCGCG CGTAACGTGG GATCGGAAAG CCCTCTGAAG 
ATCAAACGTG GCCAGAACAA CCTCTGGAAC AACGGCGGCA TCCAGTACGC TCCACCAGTA 
CGCTAG

Protein sequence

MKKTMIASLA AAGMLFAVAG QAHAGATLDA VKKKGFVQCG ISDGLPGFSY ADANGKFSGI 
DVDVCRGVAA ALFGDDTKVK YTPLTAKERF TALQSGEVDV LSRNTTWTSS RDAGMGMTFT 
GVTYYDGIGF LTHNKAGLKS AKELDGATVC IQAGTDTELN VADYFKANKM KYTPVTFDRS 
DESAKALESG RCDTLASDQS QLYALRIKLS NPAEWIVLPE VISKEPLGPV VRRGDEEWTS 
IVKWTLFAML NAEEMGINSK NVDEKAAAPS TPDMAHLLGK EGDYGKDLKL DNKWAYNIIK 
HVGNYGEIFA RNVGSESPLK IKRGQNNLWN NGGIQYAPPV R