Gene EcolC_3847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3847
Symbol
ID	6064404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4203009
End bp	4204148
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	53%
IMG OID	641603259
Product	iron-sulfur cluster binding protein
Protein accession	YP_001726778
Protein GI	170021824
COG category	[C] Energy production and conversion
COG ID	[COG1600] Uncharacterized Fe-S protein
TIGRFAM ID	[TIGR00276] iron-sulfur cluster binding protein, putative

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000133072
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000262117
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAGAGC CCCTCGATCT CAATCAGTTA GCGCAAAAAA TTAAACAGTG GGGGCTGGAA 
CTGGGCTTTC AGCAGGTAGG TATTACCGAT ACCGATCTCA GCGAGTCCGA GCCCAAACTG 
CAAGCATGGC TGGACAAACA ATACCACGGC GAAATGGACT GGATGGCACG TCACGGTATG 
CTGCGCGCTC GCCCTCATGA GTTATTGCCC GGTACGCTGC GCGTGATCAG CGTGCGGATG 
AATTACCTTC CTGCTAACGC CGCATTTGCC AGCACGCTGA AAAACCCCAA ACTCGGCTAT 
GTTAGCCGTT ATGCGCTGGG CCGTGACTAT CACAAACTTC TGCGCAACCG ACTCAAAAAG 
CTGGGCGAGA TGATTCAGCA ACATTGTGTT TCGCTGAATT TTAGACCGTT TGTCGATTCT 
GCGCCTATTC TCGAGCGCCC GTTAGCTGAA AAAGCTGGGC TCGGCTGGAC AGGTAAGCAC 
TCACTTATCC TCAATCGCGA GGCCGGTTCG TTCTTCTTTT TAGGCGAATT GCTGGTCGAT 
ATTCCGCTGC CCGTGGATCA ACCAGTCGAG GAAGGATGCG GCAAATGCGT GGCCTGTATG 
ACGATTTGCC CGACCGGTGC CATCGTCGAG CCATATACCG TCGATGCTCG CCGCTGTATC 
TCTTATCTCA CCATCGAACT TGAAGGGGCG ATCCCGGAAG AGTTGCGACC GTTAATGGGA 
AACCGTATTT ACGGTTGCGA TGACTGCCAG CTTATCTGCC CGTGGAATCG CTATTCACAA 
CTCACCACAG AAGAGGATTT CAGCCCGCGT AAGCCGCTAC ACGCACCGGA ACTCATTGAG 
TTATTCGCCT GGAGCGAAGA GAAGTTTTTA AAAGTCACGG AAGGATCGGC GATTCGTCGT 
ATTGGTCACC TGCGTTGGCT GCGTAATATC GCCGTAGCAT TAGGCAATGC CCCTTGGGAT 
GAAACGATTT TGACAGCGCT GGAAAGTCGT AAAGGTGAGC ACCCACTTCT CGATGAGCAC 
ATAGCGTGGG CGATTGCGCA GCAAATAGAG AGACGAAATG CGTGCATAGT CGAAGTGCAA 
TTGCCGAAAA AACAGCGTCT GGTTCGGGTG ATTGAAAAAG GGTTACCGCG TGACGCCTGA

Protein sequence

MSEPLDLNQL AQKIKQWGLE LGFQQVGITD TDLSESEPKL QAWLDKQYHG EMDWMARHGM 
LRARPHELLP GTLRVISVRM NYLPANAAFA STLKNPKLGY VSRYALGRDY HKLLRNRLKK 
LGEMIQQHCV SLNFRPFVDS APILERPLAE KAGLGWTGKH SLILNREAGS FFFLGELLVD 
IPLPVDQPVE EGCGKCVACM TICPTGAIVE PYTVDARRCI SYLTIELEGA IPEELRPLMG 
NRIYGCDDCQ LICPWNRYSQ LTTEEDFSPR KPLHAPELIE LFAWSEEKFL KVTEGSAIRR 
IGHLRWLRNI AVALGNAPWD ETILTALESR KGEHPLLDEH IAWAIAQQIE RRNACIVEVQ 
LPKKQRLVRV IEKGLPRDA