Gene RSP_4120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4120
Symbol	yapH
ID	3711836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007489
Strand	-
Start bp	85057
End bp	86430
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	66%
IMG OID	640069469
Product	hypothetical protein
Protein accession	YP_345336
Protein GI	77404763
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGACG CTACTGGGCA GCCTCATGTG GCGGCAGGGG CAATGCAGAG GTTTCGCCCT 
GGGGCCAAAG GGTCGAAGTA TGGCCTTTGG GGCGGCGTTG CCTTGGTTGC CCTGACGACT 
GGCGCGGCGG GAGCCGAAAT GGCCATCGTC GGAGACGTGA CCATCACGGG GCACATAAGC 
GCGGGAAGCA TCTCCGCGGC AACCCTCGAA GGCGCCCTCA ACGTCACCGG TCCCAGCGTA 
CTGAGCGACG CCAGCGCGAC CTCCCTCTCC GTCAGCGGCA CCTCGCAGCT CAACGCCCTA 
GCTGTTTCCG GCGCCAGCAC TCTGCAGAGC GCAACCGTTC AGGGCAACGC TGCAATCGCG 
GGCGCACTGA ACGTGGCCGG ACAAAGCACC CTCGGCGACG CGCGGATGCA GACCGCCACC 
GTTCAGAAAG CCCTTGCCGT CAACGGACCG ATGGGCGTGA GCGGCACGGC GAGCTTCGGG 
TCGGATCTGG AGGTAGGAGG CGCCGGACGC TTCGGAAGCG CCAGCGTCGC GGGAACCACT 
TCGACCGGAG CCCTTTCCGT CGCCGGCACC TCACAACTCG ACACCCTCGT CGTGTCGGGA 
GCCAGTACGA TGGCAAAGGT CGACGTGCTG GGCCCGCTGG CCGTAACCGG GGCCGCCGGC 
TTCGGCGATC TCGTTGCCAA GGACATGAGG ACGGAAGACC TGCACGTCAC CGGCAACCTG 
ACCATCGACG GAAACCTGTC GCTTCCCTCG AAGTTCTCCT TCGGAGAGCT GGAAACTACC 
GGAAGCAGCC GGCTGGCTGA TCTGCAGACG ACCGGTCAGG TTGCAATGAA CAACGCCGGC 
TCCAGCTTCA CCTTGGGCTC GTCCGGCATT CTGGCCACGA CCGCAGGGGG AGCCCGGGTG 
CAACTGACGG ACACGGCCGC AGTCCTTACC CATGGCGGCA ATGGCATCAC GGCCACGGCC 
AATGGAACCA CCCGGATCAC TGCCATACAC GAGGCAACAC TGCAGGGAGG TAACACCACC 
CTTGCCCTGA CCGACACCGG CGCCCGCCTT TCCGGATCCG GCAGCGCACC CGCCCGCCTG 
TCGGGGATCG CCGACGGCGT GGAAGACAAT GACGCCGTCA ACGTCGGGCA GCTGAATGAC 
GGGCTTCGGG AGGTGAGTGC GGGCGTCGCG ATGAGCATGG CGATGGCACA GCTTCCAGCT 
CCCCTCGACG GCAGCAATCA CTCCTTCGGC GTGGCCGTCG GTGGGTTCGA TGGCCAAGAG 
GCGCTGGCCT TGGGGGGAAC TGCCATCGTG AACAACAATG TGACGTTACG TGGCGCGCTC 
AGCCATGCCG GCGGCAAGAC GGGTGCCGGT GTCGGCGTCG GCTGGAGCTT CTGA

Protein sequence

MKDATGQPHV AAGAMQRFRP GAKGSKYGLW GGVALVALTT GAAGAEMAIV GDVTITGHIS 
AGSISAATLE GALNVTGPSV LSDASATSLS VSGTSQLNAL AVSGASTLQS ATVQGNAAIA 
GALNVAGQST LGDARMQTAT VQKALAVNGP MGVSGTASFG SDLEVGGAGR FGSASVAGTT 
STGALSVAGT SQLDTLVVSG ASTMAKVDVL GPLAVTGAAG FGDLVAKDMR TEDLHVTGNL 
TIDGNLSLPS KFSFGELETT GSSRLADLQT TGQVAMNNAG SSFTLGSSGI LATTAGGARV 
QLTDTAAVLT HGGNGITATA NGTTRITAIH EATLQGGNTT LALTDTGARL SGSGSAPARL 
SGIADGVEDN DAVNVGQLND GLREVSAGVA MSMAMAQLPA PLDGSNHSFG VAVGGFDGQE 
ALALGGTAIV NNNVTLRGAL SHAGGKTGAG VGVGWSF