Gene EcE24377A_4787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4787
Symbol
ID	5589428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4779130
End bp	4780473
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	51%
IMG OID	640928397
Product	putative transporter
Protein accession	YP_001465725
Protein GI	157157274
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAACA GTATTTTAGT CATACTCTGC TTGATCGCTG TAAGTGCGTT CTTCTCGATG 
TCTGAGATCT CACTTGCCGC CTCACGCAAA ATCAAACTTA AACTGCTGGC TGATGAAGGC 
AATATAAATG CCCAACGCGT TCTGAATATG CAGGAAAATC CCGGCATGTT CTTTACGGTG 
GTCCAAATCG GTCTGAACGC AGTTGCGATT CTCGGCGGTA TCGTCGGTGA TGCGGCATTT 
TCTCCAGCTT TTCACAGCCT GTTCTCCCGC TATATGTCGG CAGAACTCTC TGAGCAACTG 
AGCTTTATTC TCTCTTTCTC GTTAGTGACT GGCATGTTTA TCCTGTTTGC GGATTTAACC 
CCGAAACGCA TCGGTATGAT TGCGCCAGAA GCGGTGGCTT TGCGTATCAT CAACCCGATG 
CGCTTCTGCC TGTACGTTTG CACCCCGCTG GTGTGGTTCT TCAACGGCCT GGCGAACATG 
ATCTTCCGTA TTTTCAAACT GCCAATGGTA CGTAAAGATG ACATCACTTC TGATGACATC 
TACGCGGTAG TGGAAGCCGG TGCGCTGGCG GGCGTGTTAC GTAAACAGGA ACACGAGCTG 
ATTGAAAACG TCTTTGAGCT GGAATCCCGT ACCGTTCCGT CTTCAATGAC ACCGCGTGAA 
AACGTGATTT GGTTTGATCT CCACGAAGAT GAGCAAAGCC TGAAGAATAA GGTGGCGGAA 
CATCCGCACT CTAAGTTCCT CGTCTGTAAT GAAGATATTG ACCACATCAT CGGTTATGTC 
GATTCTAAAG ACCTGCTGAA CCGCGTGCTG GCTAACCAAA GCCTGGCACT GAACAGCGGC 
GTACAAATTC GCAACACGCT GATTGTGCCG GATACGTTAA CCCTTTCAGA GGCGTTGGAA 
AGTTTTAAAA CCGCAGGTGA AGACTTCGCG GTGATCATGA ACGAGTACGC GCTGGTGGTG 
GGGATCATCA CCCTCAATGA CGTGATGACC ACGCTGATGG GCGATCTGGT CGGTCAGGGG 
CTGGAAGAGC AGATTGTCGC CCGTGATGAG AACTCATGGC TGATTGACGG CGGCACCCCG 
ATTGACGACG TCATGCGCGT ACTGGATATT GACGAGTTCC CGCAGTCGGG CAACTACGAA 
ACCATCGGCG GCTTTATGAT GTTTATGCTG CGTAAGATCC CGAAACGCAC CGATTCGGTG 
AAATTCGCCG GCTACAAATT TGAAGTGGTG GATATCGATA ACTACCGCAT CGACCAGCTG 
CTGGTGACCC GGATCGACAG CAAGGCCACC GCCCTTTCGC CAAAACTGCC TGACGCTAAA 
GATAAAGAAG AAAGCGTCGC GTAA

Protein sequence

MLNSILVILC LIAVSAFFSM SEISLAASRK IKLKLLADEG NINAQRVLNM QENPGMFFTV 
VQIGLNAVAI LGGIVGDAAF SPAFHSLFSR YMSAELSEQL SFILSFSLVT GMFILFADLT 
PKRIGMIAPE AVALRIINPM RFCLYVCTPL VWFFNGLANM IFRIFKLPMV RKDDITSDDI 
YAVVEAGALA GVLRKQEHEL IENVFELESR TVPSSMTPRE NVIWFDLHED EQSLKNKVAE 
HPHSKFLVCN EDIDHIIGYV DSKDLLNRVL ANQSLALNSG VQIRNTLIVP DTLTLSEALE 
SFKTAGEDFA VIMNEYALVV GIITLNDVMT TLMGDLVGQG LEEQIVARDE NSWLIDGGTP 
IDDVMRVLDI DEFPQSGNYE TIGGFMMFML RKIPKRTDSV KFAGYKFEVV DIDNYRIDQL 
LVTRIDSKAT ALSPKLPDAK DKEESVA