Gene EcolC_3787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3787
Symbol
ID	6066462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4145845
End bp	4147578
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	53%
IMG OID	641603200
Product	surface antigen (D15)
Protein accession	YP_001726719
Protein GI	170021765
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0729] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.718556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCTATA TCCGACAGTT ATGCTGTGTA AGCTTACTCT GCTTAAGCGG ATCTGCCGTC 
GCCGCGAACG TCCGTCTACA GGTCGAGGGG TTATCGGGAC AGCTGGAAAA GAACGTTCGT 
GCGCAGCTTT CTACGATTGA AAGTGATGAA GTGACGCCAG ACCGTCGCTT TCGCGCACGC 
GTCGATGATG CCATCCGCGA AGGTCTGAAA GCGCTGGGTT ATTACCAGCC GACCATTGAA 
TTTGATCTCC GTCCACCGCC AAAGAAAGGG CGGCAGGTAT TGATCGCCAA AGTCACGCCA 
GGCGTGCCGG TGTTAATTGG CGGCACCGAT GTGGTATTGC GCGGCGGCGC GCGGACCGAT 
AAAGACTATT TGAAATTGCT CGATACTCGC CCGGCTATTG GCACGGTGCT GAACCAGGGC 
GATTATGAAA ATTTCAAAAA GTCCTTAACC AGCATTGCGT TGCGTAAAGG TTATTTCGAT 
AGCGAATTTA CCAAAGCGCA GCTGGGCATT GCGCTCGGCC TGCATAAAGC CTTCTGGGAT 
ATTGATTATA ACAGTGGCGA ACGTTACCGC TTTGGGCATG TGACCTTTGA AGGATCACAA 
ATCCGCGATG AATACCTGCA AAATCTGGTG CCGTTTAAAG AGGGCGATGA GTACGAATCG 
AAAGATCTGG CGGAACTGAA CCGCCGACTT TCTGCTACCG GCTGGTTTAA CTCGGTGGTG 
GTGGCTCCAC AATTTGATAA AGCGCGCGAA ACGAAAGTAT TACCATTGAC GGGCGTGGTT 
TCGCCGCGAA CAGAAAACAC CATCGAAACC GGGGTCGGTT ACTCTACGGA CGTGGGACCG 
CGCGTGAAAG CGACGTGGAA AAAACCGTGG ATGAACTCAT ACGGTCACAG TCTGACCACC 
AGTACCAGTA TTTCCGCGCC GGAACAGATC CTCGACTTCA GCTATAAAAT GCCGCTGCTG 
AAGAATCCAC TGGAACAATA TTATTTGGTG CAGGGCGGTT TTAAGCGCAC TGACCTGAAC 
GATACCGAAT CTGACTCCAC TACGCTGGTG GCTTCTCGCT ACTGGGATCT CTCCAGCGGC 
TGGCAGCGTG CCATTAACCT GCGCTGGAGT CTCGACCACT TTACCCAGGG TGAAATTACC 
AACACCACGA TGCTGTTTTA TCCTGGGGTG ATGATTAGCC GCACGCGTTC TCGTGGTGGC 
CTGATGCCAA CCTGGGACGA CTCGCAACGC TACTCTATCG ACTACTCCAA CACTGCCTGG 
GGCTCAGATG TCGATTTCTC CGTTTTCCAG GCACAAAACG TCTGGATCCG CACACTGTAC 
GATCGCCATC GTTTTGTGAC ACGCGGCACG CTGGGCTGGA TTGAAACCGG TGATTTCGAC 
AAAGTACCGC CGGATCTGCG TTTTTTCGCC GGGGGCGACC GCAGTATTCG TGGCTACAAA 
TACAAATCTA TCGCTCCGAA ATACGCCAAC GGTGACCTGA AAGGGGCCTC GAAGTTGATA 
ACCGGATCGC TGGAGTACCA GTACAACGTG ACCGGAAAAT GGTGGGGCGC GGTGTTTGTC 
GATAGTGGCG AAGCGGTAAG CGATATTCGC CGCAGCGACT TTAAAACCGG TACCGGGGTC 
GGCGTACGCT GGGAATCGCC GGTCGGGCCA ATCAAACTCG ATTTTGCCGT ACCGGTCGCG 
GATAAAGACG AACACGGGTT ACAGTTTTAC ATCGGTCTGG GGCCAGAATT ATGA

Protein sequence

MRYIRQLCCV SLLCLSGSAV AANVRLQVEG LSGQLEKNVR AQLSTIESDE VTPDRRFRAR 
VDDAIREGLK ALGYYQPTIE FDLRPPPKKG RQVLIAKVTP GVPVLIGGTD VVLRGGARTD 
KDYLKLLDTR PAIGTVLNQG DYENFKKSLT SIALRKGYFD SEFTKAQLGI ALGLHKAFWD 
IDYNSGERYR FGHVTFEGSQ IRDEYLQNLV PFKEGDEYES KDLAELNRRL SATGWFNSVV 
VAPQFDKARE TKVLPLTGVV SPRTENTIET GVGYSTDVGP RVKATWKKPW MNSYGHSLTT 
STSISAPEQI LDFSYKMPLL KNPLEQYYLV QGGFKRTDLN DTESDSTTLV ASRYWDLSSG 
WQRAINLRWS LDHFTQGEIT NTTMLFYPGV MISRTRSRGG LMPTWDDSQR YSIDYSNTAW 
GSDVDFSVFQ AQNVWIRTLY DRHRFVTRGT LGWIETGDFD KVPPDLRFFA GGDRSIRGYK 
YKSIAPKYAN GDLKGASKLI TGSLEYQYNV TGKWWGAVFV DSGEAVSDIR RSDFKTGTGV 
GVRWESPVGP IKLDFAVPVA DKDEHGLQFY IGLGPEL