Gene Rsph17025_1398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1398
Symbol
ID	5083072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1426984
End bp	1427970
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	72%
IMG OID	640482956
Product	hemin-degrading family protein
Protein accession	YP_001167600
Protein GI	146277441
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3720] Putative heme degradation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.435913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCTG CCGAGATCCG CAAGGCCCGT GCCGCCAATC ACCGCGCCCG TGCCCGCGAC 
TTTGCCGACA GCCACGGTCT TGCCGAGGCG GCACTGGTCG CGGCCTTTAC AGGGAAGGGG 
GTCGTGGCGG TGGAGGCCGG GCCCGAGAGG CTTCTGCCGC CTGTGCGCCA GCTGGGCGAG 
AGCCTGGCCC TGACCCGCAA CGCCTCGGCC GTGCAGGAGC GCGAGCGCCG CTATGGCCCG 
CTTGCGCCCC TCGGCGAGGG ATGGACCCTG ACGGGCGACG GGATCGAGCT GCAGATCGAT 
CCGCGGCATT GGGTTCATGC CTTTGCCGTG ACCGAGGAAA CGGCGAAAGG GGCCAAACGC 
TCGATCCAGG TCTTCGACGC GGCCGGCGAG GCGGTGCACA AGATCCACCT GACCGCGACC 
AGCGACGTGG CGGCCTTCGG GCGCCTGATC GAGGAACTGC GGCTGGCGAA GCAGAGCGAC 
ACGCTTCCGC TCGTTCCCGC GGGCCCGGCG GCCCCGTCGG GCAGCCCGGC CGACGCCGGC 
CTGACGCAGC TGTGGGATGA ATCGCCCTCG CCGGAGGCCC TTGGCCCCCG GTTGGCAGCC 
GCGGGGATCT CGCCGCCCGA TGTCCTCAAG GAACTGGGGG CGCCGAGGGC CCGGCCGCTT 
CGGCCTGTCG CGATGACCGA ACTGCTTGAG CGGGCGGCCG CGGGCGGAGT GCCGCTGGAG 
ATCCGCGGAG GCAACCCCGG GTGCCTGCAG ATCTTCCGCG GCCGGGTAGA GCGCATCCTG 
CCGGCCGGCT ACTGGATCAA CGTCATGGAT CCCGGCTACA ACCTGCATCT GCGCACCGAC 
CACCTGGCCT CGGTGTTTCT CACCGACCGG GGCCCTGCGG GCGGCCTGAC GGTCGAGGCC 
TATGATGCGG CCGGCAGCCT GATCCTTGCC GTCACGGGCG AGGCGGGGTG GGATCAGGTG 
GCACAGGGGC TTTCGGCCGT GCCCTGA

Protein sequence

MTPAEIRKAR AANHRARARD FADSHGLAEA ALVAAFTGKG VVAVEAGPER LLPPVRQLGE 
SLALTRNASA VQERERRYGP LAPLGEGWTL TGDGIELQID PRHWVHAFAV TEETAKGAKR 
SIQVFDAAGE AVHKIHLTAT SDVAAFGRLI EELRLAKQSD TLPLVPAGPA APSGSPADAG 
LTQLWDESPS PEALGPRLAA AGISPPDVLK ELGAPRARPL RPVAMTELLE RAAAGGVPLE 
IRGGNPGCLQ IFRGRVERIL PAGYWINVMD PGYNLHLRTD HLASVFLTDR GPAGGLTVEA 
YDAAGSLILA VTGEAGWDQV AQGLSAVP