Gene EcolC_1831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1831
Symbol
ID	6067413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2030899
End bp	2032023
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	52%
IMG OID	641601245
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001724807
Protein GI	170019853
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.279236
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC TGAGCCCTGA CTTTGTACTA CCCGAAAATT TTTGCGCTAA CCCGCAAGAG 
GCGTGGACCA TTCCTGCCCG TTTTTATACC GATCAGAACG CGTTTGAACA CGAAAAAGAG 
AACGTCTTCG CCAAAAGCTG GATTTGCGTC GCTCACAGCA GCGAACTGGC GAATGCCAAT 
GATTATGTGA CGCGTGAGAT CATTGGCGAA AGCATCGTGC TGGTACGCGG TCGTGATAAG 
GTTTTGCGCG CGTTCTATAA CGTGTGTCCG CACCGTGGTC ATCAGTTGTT GAGCGGTGAA 
GGAAAAGCAA AAAATGTGAT TACCTGCACG TATCACGCAT GGGCATTCAA ACTCGATGGC 
AACCTGGCCC ATGCACGTAA CTGCGAAAAC GTCGCCAATT TCGATAGCGA CAAAGCGCAA 
CTGGTTCCGG TGCGTCTGGA AGAATATGCC GGATTCGTCT TCATCAACAT GGACCCCAAC 
GCCACCAGCG TAGAAGATCA GTTACCCGGT CTGGGCGCGA AAGTGCTGGA AGCCTGCCCG 
GAAGTCCACG ATCTGAAACT GGCGGCCCGC TTTACCACCC GCACGCCTGC CAACTGGAAG 
AACATTGTCG ATAACTATCT CGAGTGCTAT CACTGTGGTC CGGCGCATCC AGGTTTCTCC 
GACTCCGTAC AGGTTGATCG TTACTGGCAC ACCATGCACG GTAACTGGAC GCTGCAATAC 
GGTTTCGCCA AACCGTCCGA ACAGTCGTTT AAATTTGAAG AGGGTACGGA TGCGGCATTC 
CACGGTTTCT GGCTGTGGCC GTGCACGATG CTGAACGTCA CCCCGATCAA AGGGATGATG 
ACGGTCATTT ATGAATTCCC GGTGGATTCT GAAACTACCC TGCAAAACTA CGATATTTAC 
TTCACCAATG AAGAGTTAAC CGACGAGCAA AAATCGCTGA TTGAGTGGTA TCGCGATGTG 
TTCCGTCCGG AAGATTTACG TCTGGTTGAA AGCGTACAGA AAGGGCTGAA ATCGCGTGGC 
TATCGTGGTC AGGGGCGCAT CATGGCCGAC AGTAGCGGTA GTGGCATTTC CGAACATGGT 
ATCGCCCATT TCCATAATCT GCTGGCGCAG GTGTTTAAGG ACTAA

Protein sequence

MSNLSPDFVL PENFCANPQE AWTIPARFYT DQNAFEHEKE NVFAKSWICV AHSSELANAN 
DYVTREIIGE SIVLVRGRDK VLRAFYNVCP HRGHQLLSGE GKAKNVITCT YHAWAFKLDG 
NLAHARNCEN VANFDSDKAQ LVPVRLEEYA GFVFINMDPN ATSVEDQLPG LGAKVLEACP 
EVHDLKLAAR FTTRTPANWK NIVDNYLECY HCGPAHPGFS DSVQVDRYWH TMHGNWTLQY 
GFAKPSEQSF KFEEGTDAAF HGFWLWPCTM LNVTPIKGMM TVIYEFPVDS ETTLQNYDIY 
FTNEELTDEQ KSLIEWYRDV FRPEDLRLVE SVQKGLKSRG YRGQGRIMAD SSGSGISEHG 
IAHFHNLLAQ VFKD