Gene EcHS_A1056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1056
Symbol
ID	5592136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1068105
End bp	1069214
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	50%
IMG OID	640920221
Product	MOSC domain-containing protein
Protein accession	YP_001457786
Protein GI	157160468
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0633] Ferredoxin [COG3217] Uncharacterized Fe-S protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000000000706044
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGACAT TAATCCGGCT TTTTATTCAT CCTGTTAAAT CGATGCGCGG CATTGGTCTT 
ACACATGCTC TGGCAGATGT CAGTGGTCTG GCCTTCGATC GCATCTTTAT GATCACGGAA 
CCTGACGGTA CGTTTATTAC CGCTCGCCAG TTTCCCCAGA TGGTACGGTT TACTCCTTCA 
CCTGTGCATG ATGGCTTGCA TCTCACCGCA CCAGATGGCA GTAGCGCATA TGTTCGTTTT 
GCTGATTTCG CCACACAAGA CGCACCAACC GAAGTTTGGG GCACACATTT TACCGCGCGA 
ATTGCGCCAG ACGCGATCAA CAAATGGCTA AGTGGATTTT TCTCCCGCGA AGTGCAATTA 
CGCTGGGTGG GGCCACAAAT GACCCGGCGC GTGAAACGCC ACAACACTGT ACCTCTGTCA 
TTTGCTGATG GCTATCCTTA CCTTCTTGCT AACGAAGCCT CGTTACGTGA TCTCCAACAA 
CGTTGTCCGG CCAGTGTAAA AATGGAGCAA TTCCGCCCCA ATCTGGTGGT TTCCGGCGCG 
TCAGCCTGGG AAGAAGATCG CTGGAAAGTG ATTCGCATTG GTGATGTGGT GTTTGATGTG 
GTTAAACCTT GTAGCCGCTG TATTTTCACC ACCGTCAGCC CAGAAAAAGG GCAAAAACAT 
CCGGCAGGCG AACCATTAAA AACATTGCAA TCTTTCCGCA CTGCCCAGGA TAACGGCGAT 
GTCGATTTTG GTCAGAATTT AATTGCCCGT AATAGCGGCG TGATTCGCGT TGGCGATGAG 
GTGGAAATTC TGGCAACGGC TCCGGCAAAA ATTTACGGCG CAGCTGCCGC TGATGATACC 
GCCAACATCA CGCAACAACC GGACGCAAAT GTAGATATTG ACTGGCAGGG ACAGGCATTT 
CGTGGAAATA ACCAACAGGT GTTGCTGGAG CAATTAGAAA ATCAGGGAAT TCGTATCCCT 
TATTCTTGCC GCGCGGGCAT TTGTGGAAGT TGCCGTGTTC AGCTTTTAGA AGGCGAAGTC 
ACGCCGCTGA AAAAATCAGC AATGGGCGAT GATGGCACCA TTCTTTGCTG TAGCTGTGTA 
CCGAAGACTG CACTTAAGTT GGCGCGTTAG

Protein sequence

MATLIRLFIH PVKSMRGIGL THALADVSGL AFDRIFMITE PDGTFITARQ FPQMVRFTPS 
PVHDGLHLTA PDGSSAYVRF ADFATQDAPT EVWGTHFTAR IAPDAINKWL SGFFSREVQL 
RWVGPQMTRR VKRHNTVPLS FADGYPYLLA NEASLRDLQQ RCPASVKMEQ FRPNLVVSGA 
SAWEEDRWKV IRIGDVVFDV VKPCSRCIFT TVSPEKGQKH PAGEPLKTLQ SFRTAQDNGD 
VDFGQNLIAR NSGVIRVGDE VEILATAPAK IYGAAAADDT ANITQQPDAN VDIDWQGQAF 
RGNNQQVLLE QLENQGIRIP YSCRAGICGS CRVQLLEGEV TPLKKSAMGD DGTILCCSCV 
PKTALKLAR