Gene EcolC_2207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2207
Symbol
ID	6065879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2426973
End bp	2428034
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	50%
IMG OID	641601613
Product	putative receptor
Protein accession	YP_001725172
Protein GI	170020218
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0362062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTTAC GTCATCTGTT TTCATCGCGC CTGCGTGGTT CATTACTGTT AGGTTCATTG 
CTTGTTGCTT CATCATTCAG TACGCAGGCC GCAGAAGAAA TGCTGCGTAA AGCGGTAGGT 
AAAGGTGCCT ACGAAATGGC TTATAGCCAG CAAGAAAACG CACTGTGGCT CGCCACTTCG 
CAAAGCCGCA AACTGGATAA AGGTGGCGTG GTTTATCGTC TTGATCCGGT CACTCTGGAA 
GTGACGCAGG CGATCCATAA CGATCTCAAG CCGTTTGGTG CCACCATCAA TAACACGACT 
CAGACGTTGT GGTTTGGTAA CACCGTAAAC AGCGCGGTCA CGGCGATAGA TGCCAAAACG 
GGCGAAGTGA AAGGCCGTCT GGTGCTGGAT GATCGTAAGC GCACGGAAGA GGTGCGCCCG 
CTGCAACCGC GTGAGCTGGT AGCTGATGAT GCCACGAACA CCGTTTACAT CAGTGGTATT 
GGTAAAGAGA GCGTGATTTG GGTCGTTGAT GGCGAGAATA TCAAACTGAA AACCGCCATC 
CAGAACACCG GTAAAATGAG TACCGGTCTG GCGCTGGATA GCAAAGGCAA ACGTCTTTAC 
ACCACTAACG CTGACGGCGA ATTGATTACC ATCGACACCG CCGACAATAA AATCCTCAGC 
CGTAAAAAGC TGCTGGATGA CGGCAAAGAG CACTTCTTTA TCAACATTAG CCTTGATACC 
GCCAGGCAGC GTGCATTTAT CACCGATTCT AAAGCCGCAG AAGTGTTAGT GGTCGATACC 
CGTAATGGCA ATATTCTGGC GAAGGTTGCG GCACCAGAAT CACTGGCTGT GCTGTTTAAC 
CCAGCGCGTA ATGAAGCCTA CGTAACGCAT CGTCAGGCAG GTAAAGTCAG TGTGATTGAC 
GCGAAAAGCT ATAAAGTGGT GAAAACGTTC GATACGCCGA CTCATCCAAA CAGCCTGGCG 
CTGTCTGCCG ATGGCAAAAC GCTGTATGTC AGTGTGAAAC AAAAATCCAC TAAACAGCAG 
GAAGCTACCC AGCCGGACGA TGTGATTCGT ATTGCGCTGT AA

Protein sequence

MHLRHLFSSR LRGSLLLGSL LVASSFSTQA AEEMLRKAVG KGAYEMAYSQ QENALWLATS 
QSRKLDKGGV VYRLDPVTLE VTQAIHNDLK PFGATINNTT QTLWFGNTVN SAVTAIDAKT 
GEVKGRLVLD DRKRTEEVRP LQPRELVADD ATNTVYISGI GKESVIWVVD GENIKLKTAI 
QNTGKMSTGL ALDSKGKRLY TTNADGELIT IDTADNKILS RKKLLDDGKE HFFINISLDT 
ARQRAFITDS KAAEVLVVDT RNGNILAKVA APESLAVLFN PARNEAYVTH RQAGKVSVID 
AKSYKVVKTF DTPTHPNSLA LSADGKTLYV SVKQKSTKQQ EATQPDDVIR IAL