Gene EcolC_0438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0438
Symbol
ID	6067924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	474875
End bp	475900
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	49%
IMG OID	641599844
Product	extracellular solute-binding protein
Protein accession	YP_001723443
Protein GI	170018489
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.503691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA TGATGATAGC CACACTGGCT GCCGCCAGCG TGCTGCTTGC CGTTGCAAAT 
CAGGCGCATG CTGGCGCGAC GCTTGATGCC GTACAGAAAA AAGGTTTTGT GCAATGCGGG 
ATCAGTGATG GATTACCTGG GTTCTCTTAT GCCGATGCTG ACGGTAAATT TTCAGGTATT 
GATGTTGATA TTTGTCGTGG TGTTGCCGCT GCTGTATTTG GTGACGACAC GAAAGTGAAA 
TATACCCCAC TCACAGCAAA AGAACGCTTC ACGGCTTTAC AGTCAGGGGA AGTGGATTTG 
CTCTCCCGTA ATACGACCTG GACTTCATCT CGCGACGCCG GGATGGGAAT GGCATTTACT 
GGCGTCACTT ATTACGACGG CATTGGCTTC CTGACGCACG ATAAAGCGGG GCTAAAAAGC 
GCGAAAGAAC TGGATGGCGC TACCGTCTGT ATTCAGGCGG GTACTGATAC CGAACTCAAC 
GTTGCCGACT ATTTCAAGGC AAACAATATG AAGTACACAC CGGTGACTTT CGATCGCTCT 
GACGAATCAG CGAAGGCACT GGAATCTGGT CGCTGCGATA CGCTGGCCTC GGATCAGTCG 
CAACTGTATG CCCTGCGCAT CAAATTAAGC AACCCAGCTG AATGGATTGT CTTACCGGAG 
GTTATCTCTA AAGAACCGCT TGGGCCGGTA GTTCGTCGTG GCGATGATGA ATGGTTCTCG 
ATTGTACGCT GGACGCTTTT CGCCATGCTG AATGCTGAAG AGATGGGCAT CAATTCCCAG 
AACGTTGATG AAAAAGCGGC TAATCCAGCA ACGCCTGATA TGGCACATCT GCTGGGTAAA 
GAAGGCGATT ACGGCAAGGA TCTGAAGTTG GATAATAAAT GGGCCTATAA CATCATCAAA 
CAGGTGGGTA ACTACTCGGA AATTTTTGAG CGTAACGTAG GTTCAGAAAG CCCGCTGAAA 
ATTAAACGTG GGCAAAATAA TCTCTGGAAT AACGGCGGTA TTCAGTACGC ACCGCCCGTG 
CGTTAA

Protein sequence

MKKMMIATLA AASVLLAVAN QAHAGATLDA VQKKGFVQCG ISDGLPGFSY ADADGKFSGI 
DVDICRGVAA AVFGDDTKVK YTPLTAKERF TALQSGEVDL LSRNTTWTSS RDAGMGMAFT 
GVTYYDGIGF LTHDKAGLKS AKELDGATVC IQAGTDTELN VADYFKANNM KYTPVTFDRS 
DESAKALESG RCDTLASDQS QLYALRIKLS NPAEWIVLPE VISKEPLGPV VRRGDDEWFS 
IVRWTLFAML NAEEMGINSQ NVDEKAANPA TPDMAHLLGK EGDYGKDLKL DNKWAYNIIK 
QVGNYSEIFE RNVGSESPLK IKRGQNNLWN NGGIQYAPPV R