Gene EcHS_A1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1102
Symbol
ID	5591375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1113125
End bp	1114198
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	49%
IMG OID	640920265
Product	4Fe-4S ferredoxin iron-sulfur binding domain-containing protein
Protein accession	YP_001457829
Protein GI	157160511
COG category	[C] Energy production and conversion
COG ID	[COG0348] Polyferredoxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGA ATAAAAGAAC CCGCTGGCAG CGGCGGCCAG GCACGACGGG CGGCAAATTA 
CCGTGGAATG ACTGGCGTAA TGCCACGACC TGGCGTAAAG CGACGCAATT ATTACTGTTG 
GCAATGAATA TTTATATTGC CATCACGTTC TGGTATTGGG TGCGCTATTA CGAAACGGCA 
AGTAGCACGA CATTTGTCGC CAGACCGGGA GGTATCGAAG GCTGGCTACC GATTGCCGGG 
CTGATGAATC TGAAATATAG CCTTGTAACA GGTCAGTTAC CGTCCGTCCA CGCCGCCGCG 
ATGCTGTTAT TGGTCGCTTT TATCGTCATC AGTCTATTAC TCAAAAAGGC CTTTTGCTCA 
TGGTTATGCC CGGTTGGTAC GCTTTCTGAA TTAATCGGCG ATCTCGGTAA CAAACTGTTT 
GGTCGGCAAT GTGTCCTTCC CCGCTGGCTG GATATTCCTC TGCGCGGCGT GAAGTATTTG 
CTGTTGAGTT TTTTTCTCTA TATCGCGTTA TTGATGCCCG CTCAGGCGAT TCACTATTTT 
ATGTTGTCGC CCTACAGCGT GGTGATGGAC GTTAAAATGC TCGATTTCTT TCGTCATATG 
GGGACCGCGA CATTAATCAG CGTGACCGTT TTGCTGATTG CCAGCCTGTT TATTCGCCAT 
GCCTGGTGTC GTTATCTTTG CCCATATGGC GCGCTGATGG GCGTGGTTTC GCTATTGTCG 
CCGTTTAAGA TTCGTCGCAA TGCCGAAAGT TGTATCGACT GTGGCAAATG CGCAAAAAAT 
TGCCCATCAC GGATCCCGGT CGATAAATTA ATTCAGGTAC GAACAGTGGA ATGTACCGGC 
TGTATGACTT GCGTAGAGTC ATGTCCGGTA GCCTCAACAT TGACCTTTTC ACTGCAAAAA 
CCTGCGGCAA ATAAAAAAGC CTTTGCGTTG TCTGGCTGGT TAATGACGCT ACTGGTTCTG 
GGGATTATGT TTGCGGTGAT TGGTTACGCA ATGTATGCGG GAGTATGGCA AAGCCCGGTA 
CCGGATGAAT TGTACCGACG CTTAATTCCA CAAGCGCCAA TGATTGGTCA CTAA

Protein sequence

MAENKRTRWQ RRPGTTGGKL PWNDWRNATT WRKATQLLLL AMNIYIAITF WYWVRYYETA 
SSTTFVARPG GIEGWLPIAG LMNLKYSLVT GQLPSVHAAA MLLLVAFIVI SLLLKKAFCS 
WLCPVGTLSE LIGDLGNKLF GRQCVLPRWL DIPLRGVKYL LLSFFLYIAL LMPAQAIHYF 
MLSPYSVVMD VKMLDFFRHM GTATLISVTV LLIASLFIRH AWCRYLCPYG ALMGVVSLLS 
PFKIRRNAES CIDCGKCAKN CPSRIPVDKL IQVRTVECTG CMTCVESCPV ASTLTFSLQK 
PAANKKAFAL SGWLMTLLVL GIMFAVIGYA MYAGVWQSPV PDELYRRLIP QAPMIGH