Gene RSP_2972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2972
Symbol
ID	3720386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1657164
End bp	1660448
Gene Length	3285 bp
Protein Length	1094 aa
Translation table	11
GC content	73%
IMG OID	640071159
Product	hypothetical protein
Protein accession	YP_353034
Protein GI	77463530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGA GCGGCGAGCG GCAGGCATCG GAGCGGAAGG GGCGGTCGCG GCGCGGCCGG 
GCGTCGCTGT GGTTGCTGCT CAGTCTCGCG CTGGTGGCGG CCGTCGCGTG TTTTGCCACG 
CTGGCCTTCA CGGGGCGGCC GCTGCCCTTG CCCGGCTGGG CGGTGACCGA GGCCGAGACG 
CGGATCAACC GGGCGCTGGA GCCTGCGCTG TCGGTCTCGC TCGGGGGGCT CGTGCTGACG 
GTGGAGCCGA ACTGGATCCC GCGGCTCCGG CTCGACGATG TGCGCCTGCG GCAGGCCGAC 
GGGCGCACGC TCGTCACGCT GCCCGAGGCG CGGGTGGTGT TCGACCGGGG CGCCGCGCTG 
CGCGGCGCGC TCCATCCCAA GACCATCACC CTCTCGGGCG CGCGCATCGC GCTGCGCCGG 
CTGGCCGACG GGCGCTTCGA CTTCGCCATG GGCGAGCAGG GCGGCACCTT CCGCCTCGCA 
AGCTATGCCG AACTGCGCGA GACGGTGGAC CGGCTCTTCG CCCAGCCGGT GCTGGCGGAC 
CTCCGGCGGA TCGAGGCGGA GGGCACGACG CTGACGCTCG ATGACCGCCG CGCGGGCCGG 
ACGTGGCAGG CGGGGGACGG GCGTCTCACG CTGGTGAACG GGCCCGACCG GCGCGCGCTC 
GAGATCGGCC TGACACTTCT GAATTCCAAG GGCCGCGCGC CCGCGCAGGC GCTCGTGACC 
TTCGTCACCA CGCCCGGCAG CCCCGAGGCG CGGATCTCGG CCACGGTCGA TCATGTGGCG 
GCTGCCGACA TCGCCGCGCA GGCCGCCCCC GTGGCCTGGC TCGAGGTGCT GGATGCGGCG 
CTCTCGGGCC GCTTCTCGGC GGCGCTCGAC GGCGAGGGGC GGCTCACGCG GCTCGAGGCG 
GGGCTCGACA GCGGCGAGGG GGCGCTGCAG CCGCGGCCCG AGACCAGACC CATCGCCTTC 
GACAAGGCCG GGCTCGCCTT CGCCTACGAT CCGGGACGCG AGCGGTTGAA CCTCACCCGG 
CTCGAGGTGC AGGGCCGCTC GATCCGGCTT TCGGCGCAGG GGCACGCCTA TCTGCCGGGG 
GTCTCGCGCG GGTTGCCGAG CGAGATCCTG GCGCAGATCC GGGTCGAGGA TGCCAGCGCC 
GACCCCGAGG GCCTGTTCGA GACGCCGGTC CATTTCTCGG AAGGGGCGCT CGATCTGCGG 
ATGCGGCTCG ATCCGTTCCG GGTGGACATC GGGCAGCTCG CGCTGGTCGA GCAGGGGCGG 
CGCCTGTCGG GGCGCGGCCA TGCCTCGGCC GAACCGGGCG GCTGGCGCGT GGCCTTCGAC 
CTCGGGCTGA ACGAGATCTC GCATTCCGAC CTGCTCGCGC TCTGGCCGCT GTCGCTGGTG 
TCGAAGACCC GGGAATGGCT GGAGGAGAAT GTGCAGGAGG GGCGGCTGTT CGAGGTCGAG 
GCCGGCCTGC GCATGAGCCC CGGCCACGAG ACGCGCCTGT CGCTCGGCTA CGAGTTCCGC 
GACGGGGACG TGCGCTATCT CAAAACCCTG CCGCCTATCG AGAAAGGGTC GGGCTATGCC 
TCGATCGAGG ATCGCCGCTA TCTGATGGTG CTGGAGGAGG GGCAGGTTAC GCCCCCCGCA 
GGCGGGCCGA TCCGGGTCAC GCGCTCGGTC TTCGAAGTGC CGGACGTGAC CGAGAAACCG 
GCGCAGGCGC GGATCTCGCT CAACAGCGAG AGCGGCGTCA CGGCGGCCCT GTCGCTGCTG 
GACCAGCCGC CGTTCCGCTT CCTCGAAAAG GCCGGCCGCT CGGTCGATCT GGGAGAGGGC 
GTCGCGGTGA TGGAGACGGC GCTCTCCCTG CCGCTGAAGC GCAAGGTCGA GCCCGAGGAT 
GTCGAGTTCT CGGTCCGCGG CACGATCACC GACTTCCGCT CCGACACGCT GGTGCCCGGC 
CGCCGCATCG TGGCGCCCCG CCTTGCGCTC GAGGCGGAGC CCGAGGGTCT GACCGTGACC 
GGCGCGGGCA GCTTCGGCCG GGTGCCGTTC GATGCGACCT ACCGGCTGGC CTTCGGCCGC 
GAGGCGGAAG GACGGTCGTC GGTCGAGGGC ACCGCCACCC TCTCGCCTGC CGCCGTCGAG 
GAGTTCAAGC TGGGTCTGCC CGCAGGCACC GTCGAGGGCC GCGCGCCCGG CCGCTTCCGG 
GTGGAGATGG AGAAGGGCCG CGATCCGCGG CTCACGCTCT CGTCGGACCT CGTAGGGCTG 
CGCACGGGTC TGGCCGCGAT CGGCTGGTCG AAGCCCGCGA ACCGCGCGGG CCGGCTCGAG 
GTCGAGGCGT CGCTGGGCAA GCCGGTCACG GTCGGCAAGC TCGTGCTGGA GGGGGGCGGG 
CTCGCGGCCT CGGGCCGGGT CGATCTGCGC GCCGACGGCG GGCTGGATGC CGTGCGCTTC 
GACCGGGTGC GGCTGAACGG CTGGCTCGAT GCGCCGGTGA CGCTGGTCGG GCGGGGCGCG 
AACCAGCCGC CCGAGGTGCA GCTGCGGGGC GGGTCGGTCG ATCTCACGCG GCTGGGCGAT 
CTGGGCGGCG GGGGCGGCAG CGGGGGCACG CCGGTGCCGA TCCTCGTCGC GCTCGACCGG 
CTGCAGGTCA CGTCGGGCAT CGCGCTGACC GGCGTCGAGG GGCGCTTCGG CACCCGCGGC 
GGGTTCAACG GCGCCTTCCG CGGACGGGTG AACGGGCGCG CCGTCGTCGA AGGGTCGGTG 
GTCCCGATGA GCGGGCGCAG CGCCGTGCGG CTGAGATCCC GGGACGCGGG CGGCGTGATC 
GCCTCGGCGG GGATCTTTCC CGATGCGCGG GGCGGCGATC TCGACCTGAG CCTCATGCCC 
GAGGGACGCG ACGGCTACCG CGGACGGGCG GCGGTCTCGA ACTTCCGCGT GACGAATGCG 
CCGGTGCTGG CGGCACTCCT CAATGCGATT TCGGTGGTGG GCCTTCTCGA GCAGCTGAAC 
GGCGACGGGC TGCTCTTCGC CGAGGGCGAT GTCCGGTTCC GCGTCCAGCC GGGGGCGGTC 
GAGATCTCCG AGGCCTCGGC GGTGGGGGCC TCGATGGGGG TCACGCTGGA GGGGCTCTAT 
CGCACCGCCG ACCGGCGGCT CGACCTGCAG GGGGTGATCT CGCCCATCTA TCTGCTGAAC 
GGCATCGGCT CGGTGCTGAC CCGGCGCGGC GAGGGGCTGT TCGGTTTCAA CTATTCCGTG 
ACCGGATCGG CCGACCGCCC GGCCGTCTCG GTGAACCCGC TCTCGATCCT CACGCCCGGC 
ATGTTCCGCG AGATCTTTCG CCGACCGGTG CCGGTTCTGC CCTGA

Protein sequence

MAESGERQAS ERKGRSRRGR ASLWLLLSLA LVAAVACFAT LAFTGRPLPL PGWAVTEAET 
RINRALEPAL SVSLGGLVLT VEPNWIPRLR LDDVRLRQAD GRTLVTLPEA RVVFDRGAAL 
RGALHPKTIT LSGARIALRR LADGRFDFAM GEQGGTFRLA SYAELRETVD RLFAQPVLAD 
LRRIEAEGTT LTLDDRRAGR TWQAGDGRLT LVNGPDRRAL EIGLTLLNSK GRAPAQALVT 
FVTTPGSPEA RISATVDHVA AADIAAQAAP VAWLEVLDAA LSGRFSAALD GEGRLTRLEA 
GLDSGEGALQ PRPETRPIAF DKAGLAFAYD PGRERLNLTR LEVQGRSIRL SAQGHAYLPG 
VSRGLPSEIL AQIRVEDASA DPEGLFETPV HFSEGALDLR MRLDPFRVDI GQLALVEQGR 
RLSGRGHASA EPGGWRVAFD LGLNEISHSD LLALWPLSLV SKTREWLEEN VQEGRLFEVE 
AGLRMSPGHE TRLSLGYEFR DGDVRYLKTL PPIEKGSGYA SIEDRRYLMV LEEGQVTPPA 
GGPIRVTRSV FEVPDVTEKP AQARISLNSE SGVTAALSLL DQPPFRFLEK AGRSVDLGEG 
VAVMETALSL PLKRKVEPED VEFSVRGTIT DFRSDTLVPG RRIVAPRLAL EAEPEGLTVT 
GAGSFGRVPF DATYRLAFGR EAEGRSSVEG TATLSPAAVE EFKLGLPAGT VEGRAPGRFR 
VEMEKGRDPR LTLSSDLVGL RTGLAAIGWS KPANRAGRLE VEASLGKPVT VGKLVLEGGG 
LAASGRVDLR ADGGLDAVRF DRVRLNGWLD APVTLVGRGA NQPPEVQLRG GSVDLTRLGD 
LGGGGGSGGT PVPILVALDR LQVTSGIALT GVEGRFGTRG GFNGAFRGRV NGRAVVEGSV 
VPMSGRSAVR LRSRDAGGVI ASAGIFPDAR GGDLDLSLMP EGRDGYRGRA AVSNFRVTNA 
PVLAALLNAI SVVGLLEQLN GDGLLFAEGD VRFRVQPGAV EISEASAVGA SMGVTLEGLY 
RTADRRLDLQ GVISPIYLLN GIGSVLTRRG EGLFGFNYSV TGSADRPAVS VNPLSILTPG 
MFREIFRRPV PVLP