Gene Rsph17025_0478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0478
Symbol
ID	5082837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	475422
End bp	476768
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	67%
IMG OID	640482031
Product	transposase, IS4 family protein
Protein accession	YP_001166689
Protein GI	146276530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.182465
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCACC GTCCCCGTCC TCCCGAGCAG AACGACCTCT TCCGGCCGCG CCTCGTCGAC 
ATGATCGACA TGCGTCACGA GCTGGTCACG CTGTCGGCGC TGATCGACTG GGAGTTCTTC 
GAGCGCGAAT GGGCCGGGTT CTTCCCGTCG ACGACCGGAC GACCGGCGAC ATCGCCCCGG 
CTCGTGGCGG GGCTGCTCTA TCTGCAGCAC GCGTTCCGGC TGTCGGACGA GGCTGTGGTC 
GCGCGCTGGG TCGAGAACCC CTACTTTCAG CATTTCACCG GCGAGACCTT CTTTCAGCAT 
CGCCCGCCGA TCGACCCGAC CTCGCTCATC CGGTGGCGCA AGCGGATCGG GGAAGAGGGA 
GTCGAGTGGC TGCTGACCAA GACCATCGAG GCTGGCCGGA AGTCGGGCGC CGTCGACGAT 
GCCTGCCTCG ACGAGGTGGC GGTCGACACG ACCGTCATGG AAAAGAACAT CGCGCACCCG 
ACGGACTCCC GGCTCTACGA GCGGGCGCGC AGCCAACTGG TGGCCCTGGC CCGGGACGCC 
GGCATCGAGT TGCGGCAGAC CTACGCGCGC CTCGCGCCGC GTCTGGCGGC GCAGGTCGGG 
CGTTACGCCC ATGCCAAGCA GTTCCGGCGC ATGCGCAAGG CGTTGAGAAC GCTGAAGGGC 
TACACCGGCC GCGTGATGCG GGATCTACGC CGGCAGCTCG ACGAGATCCC CGAGGGGCCG 
TTGCGCGAGC AGGTGCTCGA CAAGCTCGTG CTGGTCTCGC GGCTGCTCCA CCAGCGGCCG 
AAGGACCCGG GCAAGATCTA CGCGCTCCAT GAGCCGGAGG TCGACTGCAT CTCGAAGGGC 
AAGGCTCGCG TCCGCTACGA GTTCGGCTGC AAGGTCAGCA TCGCCACCAC GCTGAAGGGC 
GGCTTCGTGG TCGGGATGCG CTCGCTGCCG GGGAACCCTT ACGACGGCCA CACCCTCAGC 
GAGGCGCTGG AGCAGGTGGC CATCCTCACC GACCACCCGC CGAAGCGGGC TGTCGTCGAT 
CGCGGCTATA AGGGCCATGG CGTCCAGCAC ACCCAGGTGC TGATCAGCGG CACCCGGCGC 
GGCCTGACCC CGGCGCTGAC AAAAGCCCTC CGACGGCGCA GCAGCATCGA GCCCGAGATC 
GGCCACATGA AGAGCGACGG CCGACTGTTA CGTTGCTTCC TGAAGTGCAC CTTCGGTGAC 
GCCCTCTTCG CCGTCCTCTG CGGCTGCGGC CACAACATCC GCAAGATCCT CGCCCATCTG 
AGGAACCTTC TGGCTGTCGT CATCGCCCTC ATTCTGGCGG CGATCCGGCG GGAGCAACTC 
CAGGGTTATA ACCACGCAGG TGCCTGA

Protein sequence

MKHRPRPPEQ NDLFRPRLVD MIDMRHELVT LSALIDWEFF EREWAGFFPS TTGRPATSPR 
LVAGLLYLQH AFRLSDEAVV ARWVENPYFQ HFTGETFFQH RPPIDPTSLI RWRKRIGEEG 
VEWLLTKTIE AGRKSGAVDD ACLDEVAVDT TVMEKNIAHP TDSRLYERAR SQLVALARDA 
GIELRQTYAR LAPRLAAQVG RYAHAKQFRR MRKALRTLKG YTGRVMRDLR RQLDEIPEGP 
LREQVLDKLV LVSRLLHQRP KDPGKIYALH EPEVDCISKG KARVRYEFGC KVSIATTLKG 
GFVVGMRSLP GNPYDGHTLS EALEQVAILT DHPPKRAVVD RGYKGHGVQH TQVLISGTRR 
GLTPALTKAL RRRSSIEPEI GHMKSDGRLL RCFLKCTFGD ALFAVLCGCG HNIRKILAHL 
RNLLAVVIAL ILAAIRREQL QGYNHAGA