Gene EcSMS35_0902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0902
Symbol	hcp
ID	6142977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	907061
End bp	908713
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	54%
IMG OID	641615790
Product	hydroxylamine reductase
Protein accession	YP_001742982
Protein GI	170683671
COG category	[C] Energy production and conversion
COG ID	[COG1151] 6Fe-6S prismane cluster-containing protein
TIGRFAM ID	[TIGR01703] hydroxylamine reductase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.800969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTGTG TGCAATGTGA ACAAACTATC CGTACTCCGG CAGGAAACGG CTGCTCATAC 
GCGCAGGGGA TGTGTGGTAA AACGGCGGAA ACCTCTGACC TTCAGGATTT ACTCATCGCG 
GCGCTGCAAG GGCTTTCGGC CTGGGCGGTA AAAGCGCGTG AATACGGCAT CATCAACCAC 
GATGTAGACA GCTTTGCACC ACGTGCCTTT TTCTCAACCC TGACCAACGT TAACTTCGAT 
TCCCCGCGTA TTGTCGGCTA CGCTCGTGAA GCGATTGCCC TGCGCGAGGC GCTGAAAGCA 
CAATGCCTGG CTGTAGAAGC CAACGCCCGC GTCGATAACC CGATGGCTGA CCTGCAACTG 
GTGAGCGACG ATCTCGGCGA GCTGCAACGT CAGGCAGCAG AATTTACCCC TAACAAAGAT 
AAAGCGGCGA TTGGCGAAAA CATTCTCGGC CTGCGTCTGC TGTGCCTGTA TGGCCTGAAA 
GGTGCGGCGG CCTATATGGA ACACGCGCAT GTTCTCGGTC AATACGACAA CGATATTTAT 
GCCCAGTACC ATAAAATCAT GGCGTGGCTG GGGACCTGGC CTGCCGATAT GAACGCGCTT 
CTTGAGTGTT CAATGGAAAT CGGCCAGATG AACTTCAAAG TGATGAGCAT TCTGGATGCA 
GGCGAAACCA GTAAATACGG TCACCCGACG CCAACCCAGG TCAACGTCAA AGCGACGGCA 
GGTAAATGCA TTCTGATTTC CGGTCACGAT CTCAAAGATC TCTACAACCT GCTGGAACAG 
ACCGAAGGCA CGGGCGTTAA TGTCTACACC CACGGTGAAA TGCTGCCTGC GCATGGCTAC 
CCGGAGCTGC GTAAATTCAA GCATCTGGTC GGTAACTACG GCAGCGGCTG GCAGAATCAG 
CAAGTGGAGT TCGCTCGTTT CCCTGGCCCC ATCGTGATGA CCTCGAACTG CATCATCGAC 
CCAACCGTAG GCGCTTATGA CGATCGTATC TGGACCCGCA GCATCGTTGG CTGGCCGGGT 
GTGCGTCATC TGGATGGCGA AGATTTCTCT GCGGTCATTG CCCAGGCGCA ACAAATGGCA 
GGCTTCCCGT ACAGCGAAAT TCCGCACCTG ATCACCGTGG GCTTTGGCCG CCAGACGCTG 
CTTGGCGCAG CGGATACGCT GATTGATCTG GTGAGCCGTG AAAAACTGCG TCATATCTTC 
CTGCTTGGTG GCTGTGACGG CGCACGCGGC GAACGTCACT ACTTCACCGA TTTCGCCACC 
AGCGTGCCGG ATGACTGCCT GATCCTGACC CTCGCCTGTG GTAAATATCG CTTTAATAAA 
CTTGAGTTTG GCGATATCGA AGGTCTGCCG CGTCTGGTAG ATGCAGGTCA ATGTAACGAT 
GCTTACTCAG CGATTATTCT GGCTGTCACT CTGGCAGAGA AACTGGGCTG CGGAGTCAAC 
GATCTGCCGC TGTCGCTGGT GCTATCCTGG TTTGAACAGA AAGCGATTGT CATTCTGCTG 
ACGCTGCTTT CTCTGGGTGT GAAAAATATC GTCACCGGCC CGACTGCACC TGGTTTCCTG 
ACACCAGACC TGCTGGCAGT GCTGAACGAG AAATTCGGCC TGCGTTCTAT CACCACTGTT 
GAAGAAGACA TGAAGCAACT GTTGAGCGCG TAA

Protein sequence

MFCVQCEQTI RTPAGNGCSY AQGMCGKTAE TSDLQDLLIA ALQGLSAWAV KAREYGIINH 
DVDSFAPRAF FSTLTNVNFD SPRIVGYARE AIALREALKA QCLAVEANAR VDNPMADLQL 
VSDDLGELQR QAAEFTPNKD KAAIGENILG LRLLCLYGLK GAAAYMEHAH VLGQYDNDIY 
AQYHKIMAWL GTWPADMNAL LECSMEIGQM NFKVMSILDA GETSKYGHPT PTQVNVKATA 
GKCILISGHD LKDLYNLLEQ TEGTGVNVYT HGEMLPAHGY PELRKFKHLV GNYGSGWQNQ 
QVEFARFPGP IVMTSNCIID PTVGAYDDRI WTRSIVGWPG VRHLDGEDFS AVIAQAQQMA 
GFPYSEIPHL ITVGFGRQTL LGAADTLIDL VSREKLRHIF LLGGCDGARG ERHYFTDFAT 
SVPDDCLILT LACGKYRFNK LEFGDIEGLP RLVDAGQCND AYSAIILAVT LAEKLGCGVN 
DLPLSLVLSW FEQKAIVILL TLLSLGVKNI VTGPTAPGFL TPDLLAVLNE KFGLRSITTV 
EEDMKQLLSA