Gene SbBS512_E4591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4591
Symbol	nrfA
ID	6271659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4287727
End bp	4289163
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	53%
IMG OID	641728367
Product	cytochrome c552
Protein accession	YP_001882765
Protein GI	187730383
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3303] Formate-dependent nitrite reductase, periplasmic cytochrome c552 subunit
TIGRFAM ID	[TIGR03152] formate-dependent cytochrome c nitrite reductase, c552 subunit

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAGGA TAAAAATAAA CGCACGCCGT ATCTTCAGCT TATTGATTCC TTTTTTCTTT 
TTCACTTCTG TTCACGCTGA ACAAACGGCA GCTCCCGCAA AACCTGTAAC TGTGGAAGCG 
AAGAATGAAA CCTTTGCCCC GCAGCATCCC GATCAATATC TCTCCTGGAA AGCCACCTCG 
GAACAGTCAG AGCGTGTTGA CGCCCTGGCG GAAGATCCAC GGCTGGTGAT CCTGTGGGCG 
GGGTATCCCT TCTCGCGCGA TTACAACAAG CCGCGTGGAC ATGCCTTTGC TGTGACCGAT 
GTGCGTGAAA CCCTGCGTAC CGGTGCGCCG AAAAACGCTG AAGATGGTCC GCTACCGATG 
GCGTGCTGGA GTTGTAAAAG CCCGGATGTG GCGCGTCTGA TCCAGAAAGA CGGCGAAGAT 
GGCTACTTCC ACGGTAAGTG GGCGCGCGGC GGCCCGGAAA TCGTCAACAA CTTAGGTTGT 
GCCGACTGCC ATAACACCGC CTCACCAGAG TTCGCCAAAG GCAAACCGGA GTTAACCCTT 
TCCCGTCCGT ATGCGGCTCG CGCGATGGAA GCCATTGGTA AACCTTTTGA GAAAGCCGGA 
CGTTTCGACC AGCAATCGAT GGTTTGCGGT CAGTGCCATG TGGAGTATTA CTTCGACGGC 
AAAAACAAAG CGGTTAAATT CCCGTGGGAT GACGGCATGA AAGTCGAAAA TATGGAGCAG 
TATTACGACA AAATTGCCTT CTCTGACTGG ACTAACTCCC TGTCGAAAAC GCCAATGCTG 
AAAGCGCAGC ACCCGGAATA TGAAACCTGG ACAGCGGGCA TTCACGGTAA AAACAACGTG 
ACCTGTATCG ACTGCCATAT GCCAAAAGTG CAGAACGCCG AAGGCAAACT CTACACCGAC 
CATAAAATTG GTAATCCGTT TGATAACTTC GCCCAGACTT GTGCGAACTG CCATACCCAG 
GACAAAGCTG CCTTGCAAAA AGTGGTCGCG GAACGTAAGC AGTCGATTAA CGACCTGAAA 
ATCAAGGTTG AAGATCAACT GGTTCACGCT CACTTCGAAG CGAAAGCAGC GCTGGATGCA 
GGCGCGACGG AAGCTGAAAT GAAGCCAATT CAGGACGATA TCCGTCATGC CCAGTGGCGC 
TGGGATCTGG CGATCGCTTC CCACGGCATT CATATGCACG CACCGGAAGA AGGTTTACGG 
ATGCTCGGTA CGGCGATGGA TAAAGCGGCG GATGCACGCA CCAAACTGGC GCGCCTGCTG 
GCGACCAAAG GCATCACCCA TGAAATCCAG ATCCCGGATA TCTCAACCAA AGAGAAAGCC 
CAGCAGGCCA TTGGCCTGAA CATGGAACAA ATCAAGGCCG AGAAGCAGGA CTTCATCAAA 
ACGGTGATCC CGCAGTGGGA AGAACAGGCA CGTAAAAACG GTCTGTTAAG CCAATAA

Protein sequence

MTRIKINARR IFSLLIPFFF FTSVHAEQTA APAKPVTVEA KNETFAPQHP DQYLSWKATS 
EQSERVDALA EDPRLVILWA GYPFSRDYNK PRGHAFAVTD VRETLRTGAP KNAEDGPLPM 
ACWSCKSPDV ARLIQKDGED GYFHGKWARG GPEIVNNLGC ADCHNTASPE FAKGKPELTL 
SRPYAARAME AIGKPFEKAG RFDQQSMVCG QCHVEYYFDG KNKAVKFPWD DGMKVENMEQ 
YYDKIAFSDW TNSLSKTPML KAQHPEYETW TAGIHGKNNV TCIDCHMPKV QNAEGKLYTD 
HKIGNPFDNF AQTCANCHTQ DKAALQKVVA ERKQSINDLK IKVEDQLVHA HFEAKAALDA 
GATEAEMKPI QDDIRHAQWR WDLAIASHGI HMHAPEEGLR MLGTAMDKAA DARTKLARLL 
ATKGITHEIQ IPDISTKEKA QQAIGLNMEQ IKAEKQDFIK TVIPQWEEQA RKNGLLSQ