Gene Rsph17029_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2030
Symbol
ID	4897744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2151144
End bp	2152241
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	54%
IMG OID	640112623
Product	phage integrase family protein
Protein accession	YP_001043905
Protein GI	126462791
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.755048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCA TCGTAGAACG CGCCCGCAAG GATGGCACCA AGTCATACCT CGCACAGATC 
ATACGCCGCA AGCACGGCTT CGCAGAGTCC CGAACCTTCC CCACACGCAA GACCGCCGAG 
GCATGGGCCA AGATGCGCGA GCGCGAGCTT GATGCCCAGA TCGGGGCAGG GGGCGTCCCT 
ACCACCCGTG CCGAAGTCAC CACCACCCTA GGCGACCTGA TCGACAGGTT CCTTGCGGAC 
TCTGCGAAGC CTATGGGGAA GACACAACGC AACTGCCTTA AGGTCATTCG GACTGAATAT 
GAAGTCGCCA ACAAGCGTCT TGATCAACTG ACGTCGAAAG ACCTTGTCGA AATGACGAAG 
GAGATCGGGA ACCGACCCAC AGTCCGGAGC AAGTCAACGC CACTCAATTA TCTTGCCCAT 
CTTAGCAAGT TGTTCGCCGT TGCGAGGCCC GCCTATGGGT ACCCGCTTGA TAAGTCGGTT 
CATGACGACG CACTGAAAGC GTGCAAGGCG CTAGGATACA CCGGTCAATC GGGGAAAAGG 
GATCGTCGTC CGACTGTTGG TGAGATAAAT CGTCTCATGG TCCACTTCGA TACGATGCAA 
GGCAATACCA TTCAGATGGC AAAACTCGTT CCTTTCGCGA TCTTTTCGGC AAGGCGACTG 
GATGAGATAT GCCGTATAAC ATGGACGGAT TATGAGCCGG AACATAAGCG GGTCATGGTC 
CGCGACATGA AGCACCCCGG AAACAAACAG GGAAATGATC AATTTGTAGA TTTGCCCGAT 
CCTTGTTGTG CGATAATAGA CTCGATGGAC AAGGTTGACG CGAGGATATT CCCCTTCAAC 
TCCGCCAGTG TGAGCACGGC TTGGGCAAAA GCCTGCAAGA TGCTGGAAAT CGAAAATCTC 
AAATTCCATG ATTTGCGGCA TGAGGGAGCA AGTCGCCTTT TCGAGATGGG CTGGACAATA 
CCGCAGGCGG CATCTGTTAC CGGACATAGG GCATGGGCAA CTCTACAACG CTATTCGCAC 
TTGAGACAAA CCGGCGACAA GTGGAGGGAT TGGGAATGGA TTCCTAAAGT GACGATGAAA 
CATGCAGCGA CTGGATAA

Protein sequence

MATIVERARK DGTKSYLAQI IRRKHGFAES RTFPTRKTAE AWAKMREREL DAQIGAGGVP 
TTRAEVTTTL GDLIDRFLAD SAKPMGKTQR NCLKVIRTEY EVANKRLDQL TSKDLVEMTK 
EIGNRPTVRS KSTPLNYLAH LSKLFAVARP AYGYPLDKSV HDDALKACKA LGYTGQSGKR 
DRRPTVGEIN RLMVHFDTMQ GNTIQMAKLV PFAIFSARRL DEICRITWTD YEPEHKRVMV 
RDMKHPGNKQ GNDQFVDLPD PCCAIIDSMD KVDARIFPFN SASVSTAWAK ACKMLEIENL 
KFHDLRHEGA SRLFEMGWTI PQAASVTGHR AWATLQRYSH LRQTGDKWRD WEWIPKVTMK 
HAATG