Gene EcolC_2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2303
Symbol
ID	6067006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2540058
End bp	2541119
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	56%
IMG OID	641601706
Product	hypothetical protein
Protein accession	YP_001725265
Protein GI	170020311
COG category	[S] Function unknown
COG ID	[COG3768] Predicted membrane protein
TIGRFAM ID	[TIGR01620] conserved hypothetical protein, TIGR01620

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000471514
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC CGTTAAAACC ACGTATTGAT TTCGACGGTC CTCTGGAGGT CGATCAGAAT 
CCTAAATTCA GGGCGCAGCA GACCTTTGAC GAAAATCAGG CGCAAAATTT TGCCCCGGCC 
ACGCTCGACG AAGCGCAGGA AGAAGAGGGG CAAGTCGAAG CGGTAATGGA CGCAGCGTTA 
CGTCCGAAAC GCAGCCTGTG GCGCAAAATG GTGATGGGCG GGCTGGCTCT GTTTGGCGCA 
AGCGTTGTCG GGCAGGGTGT ACAGTGGACA ATGAATGCCT GGCAAACCCA GGACTGGGTG 
GCGCTGGGTG GATGTGCCGC TGGGGCATTG ATTATCGGCG CTGGCGTAGG TTCTGTGGTA 
ACAGAGTGGC GGCGCTTATG GCGCTTGCGA CAGCGCGCCC ATGAACGCGA CGAAGCGCGT 
GATTTATTGC ATAGCCACGG CACGGGCAAA GGCCGCGCAT TTTGCGAAAA ACTGGCGCAG 
CAGGCGGGTA TTGATCAGTC GCATCCGGCG CTGCAACGCT GGTATGCCTC AATCCATGAA 
ACGCAAAACG ACCGTGAAGT GGTCAGCCTG TATGCGCATT TGGTCCAGCC AGTTTTAGAT 
GCCCAGGCGC GGCGCGAAAT CAGCCGTTCG GCGGCGGAAT CAACGTTGAT GATTGCGGTC 
AGCCCGCTGG CGTTGGTCGA TATGGCGTTT ATCGCCTGGC GCAATCTGCG TTTAATTAAT 
CGCATCGCCA CGCTGTATGG CATTGAACTG GGGTATTACA GCCGTTTGCG TCTGTTTAAG 
CTGGTATTGC TGAATATCGC TTTTGCCGGA GCCAGCGAAC TGGTGCGCGA AGTGGGGATG 
GACTGGATGT CGCAAGATCT CGCTGCTCGT TTGTCTACCC GCGCAGCTCA GGGGATTGGT 
GCAGGACTTC TGACGGCACG ACTCGGGATT AAAGCTATGG AGCTTTGCCG CCCGCTGCCG 
TGGATTGACG ATGACAAACC TCGCCTCGGG GATTTCCGTC GTCAGCTTAT CGGTCAGGTG 
AAAGAAACGC TGCAAAAAGG CAAAACGCCC AGCGAAAAAT AA

Protein sequence

MTEPLKPRID FDGPLEVDQN PKFRAQQTFD ENQAQNFAPA TLDEAQEEEG QVEAVMDAAL 
RPKRSLWRKM VMGGLALFGA SVVGQGVQWT MNAWQTQDWV ALGGCAAGAL IIGAGVGSVV 
TEWRRLWRLR QRAHERDEAR DLLHSHGTGK GRAFCEKLAQ QAGIDQSHPA LQRWYASIHE 
TQNDREVVSL YAHLVQPVLD AQARREISRS AAESTLMIAV SPLALVDMAF IAWRNLRLIN 
RIATLYGIEL GYYSRLRLFK LVLLNIAFAG ASELVREVGM DWMSQDLAAR LSTRAAQGIG 
AGLLTARLGI KAMELCRPLP WIDDDKPRLG DFRRQLIGQV KETLQKGKTP SEK