Gene EcolC_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1474
Symbol
ID	6067208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1626359
End bp	1627345
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	54%
IMG OID	641600894
Product	cobalamin synthesis protein P47K
Protein accession	YP_001724464
Protein GI	170019510
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00100223
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00332333
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCAGGA CCAACCTCAT CACCGGTTTT CTCGGCAGCG GGAAAACCAC GTCGATTCTT 
CATCTGTTAG CCCATAAAGA TCCCAACGAA AAATGGGCGG TACTGGTTAA TGAATTTGGG 
GAAGTCGGAA TTGATGGTGC TTTGCTCGCC GATAGCGGCG CATTGCTGAA AGAGATCCCC 
GGCGGCTGCA TGTGCTGCGT TAATGGTTTA CCCATGCAGG TAGGGTTGAA TACCTTACTG 
CGTCAGGGAA AACCAGACCG CTTGTTGATA GAGCCGACCG GGCTGGGCCA TCCGAAACAG 
ATCCTCGATC TGTTAACCGC ACCAGTCTAT GAACCGTGGA TAGATCTGCG CGCCACCTTG 
TGCATTCTCG ATCCACGCCT GCTGCTGGAC GAAAAAAGCG CCAGCAATGA AAACTTCCGT 
GACCAGCTGG CTGCCGCAGA CATCATTGTC GCCAATAAAT CCGACCGTGC GACGCCCGAA 
AGTGAGCAAG CGCTACAGCG TTGGTGGCAG CAAAATGGTG GCGATCGACA ATTAATTCAC 
AGTGAGCATG GGAAAGTTGA CGGTCATCTT CTGGATTTGC CGCGTCGCAA TTTAGCCGAG 
TTGCCCGCCA GCGCCGCGCA TTCTCATCAG CATGTCGTGA AAAAAGGGTT AGCAGCGTTA 
AGCCTGCCAG AGCATCAACG CTGGCGTCGC AGTCTGAACA GCGGGCAAGG ATATCAGGCC 
TGCGGCTGGA TATTCGACGC TGATACGGTA TTCGACACCA TTGGCATTCT GGAATGGGCG 
CGACTTGCAC CGGTGGAACG CGTCAAAGGC GTGCTGCGTA TTCCCGAAGG GCTGGTACGA 
ATCAACCGTC AGGGCGATGA CCTGCACATT GAAACGCAAA ACGTTGCGCC ACCGGACAGC 
CGTATTGAGC TGATTTCCAG CAGCGAAGCT GACTGGAATG CCTTACAGAG CGCGCTGTTG 
AAGCTTCGTT TAGCGACTAC CGCGTAA

Protein sequence

MTRTNLITGF LGSGKTTSIL HLLAHKDPNE KWAVLVNEFG EVGIDGALLA DSGALLKEIP 
GGCMCCVNGL PMQVGLNTLL RQGKPDRLLI EPTGLGHPKQ ILDLLTAPVY EPWIDLRATL 
CILDPRLLLD EKSASNENFR DQLAAADIIV ANKSDRATPE SEQALQRWWQ QNGGDRQLIH 
SEHGKVDGHL LDLPRRNLAE LPASAAHSHQ HVVKKGLAAL SLPEHQRWRR SLNSGQGYQA 
CGWIFDADTV FDTIGILEWA RLAPVERVKG VLRIPEGLVR INRQGDDLHI ETQNVAPPDS 
RIELISSSEA DWNALQSALL KLRLATTA