Gene RPD_3022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3022
Symbol
ID	4023525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3365987
End bp	3367972
Gene Length	1986 bp
Protein Length	661 aa
Translation table	11
GC content	62%
IMG OID	637963221
Product	myosin-cross-reactive antigen
Protein accession	YP_570149
Protein GI	91977490
COG category	[S] Function unknown
COG ID	[COG4716] Myosin-crossreactive antigen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.463393
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.320789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC CAGCCCGTCA TCCGATCAAG CCGGTTTCCG GCAAGCCTCC GATCGAGGCC 
AATGTGGGCG CAGGCTTCTG GCGCAAAGGC CCGGCCGATA CGCTGCCGCC GCCCGACATG 
GTGGGCCCGT ATATGCGCAA CCGTCCGGTG CCGGTCGCAC CTATGGAAGG CCGCAAGGCC 
TGGATCATCG GCAGCGGCAT TGCCGGGCTG TCGGCCGCCT TCTACCTGAT CCGCGACGGC 
GGCATGAAAG GCGAGGACAT CACCATCTTC GATACGCTGG AGATCGCCGG CGGCTCGCTC 
GATGGCGCCG GCAACGCCGA CGAAGGCTAC ATCATCCGCG GCGGCCGCGA GATGAATTTC 
AACTACGACA ATTTCTGGGA TGTGTTTCAG GACGTGCCAG CGCTGGAATT GCCCGACGGA 
TATAGCGTCC TCGACGAATA TCGTCTGGTG AACGACAACG ATCCGAACTG GTCGAAGGCG 
CGGCTGATGC ACAAGCAGGG CCAGATCCGC GACTTCTCGA CGCTGGGCCT GAGCAAGCTA 
CACCAGTGGG AGATCGTCAA ACTGCTGCTG AAGCGCAAGG AAGACCTCGA CGACATCACC 
ATCGAGCAAT ATTTCAGCGC CAGCTTCCTC GAAACCAATT TCTGGTATCT CTGGCGCTCG 
ATGTTCGCTT TCGAGAATTG GCAGAGCCTT CTGGAAATGA AGCTCTACAT GCATCGATTC 
ATCGATGCGA TCGACGGCCT GACCGACATG TCGGCGTTGG TTTTCCCGAA GTACAATCAG 
TATGACAGCT TCGTCGTGCC GCTGACCCGC CTGCTCAAGG AGAAGGGCGT CAAGATTCAG 
TTCGGCGTCC GGGCCTATGA TCTCGACATG GTCGAGAAGG CAGGCCGGCG CACTGTGACT 
GCCATCCGCT GCAAGAAGGC TGGTCAAAAC GACAGCATCG CCGTCGGGCC GAATGACGTC 
GTGTTCGCGC TGACGGGCTC GATGACCGAG GGCACGGCTT ACGGCGACAT GAACGTCGCC 
CCCGTACTGG CCCGGGGCAA TGCCGAACCG GGCGAGGACA GCGACTGGAC GCTGTGGAAG 
AACCTGGCAA AGAAATCGCC GATCTTCGGC AAGCCCGAGA AATTCTACGG CAATGTCGCA 
GGCTCGATGT GGGAATCGGC GACGCTCACC TGCAAGGCTT CGCCCCTTGT CGACAAGTTG 
AAGGAATTAT CGGTCAACGA TCCGGCGTCG GGCAAGACGG TGACCGGCGG AGTCATCACC 
TTCACCGACT CGAACTGGGT GTTGAGCTTC ACCTGCAACC GCCAGCCGCA TTTTCCGACC 
CAGCCCGACG ATGTGCTGGT GCTGTGGGTC TACGCCCTGC TGATGGACAA GGACGGCAAC 
TACGTCCAGA AACCGATGCC CGCCTGCACC GGCCGGGAAA TTCTGGCGGA GCTCTGCTAT 
CATCTGGGGA TCGTCGACCA GCTCGACGCG ATCGCGGCCA AGACCAAGGT TCGTCTGGCG 
CTGATGCCCT ATATCACCGC GCAATTCATG CCGCGGGCGG CGGGTGATCG CCCCCGCGTC 
GTGCCCGAGG GCTGCACCAA CCTGGCCCTC GTCGGGCAAT TCGTGGAGAC CAGCAACGAC 
GTCATCTTCA CGATGGAGTC TTCGGTGCGC ACGGCGCGGA TCGGTGTCTA TACGTTGCTG 
GGCCTGCCCA AGCAGGTCGC CGATATCAGC CCCACGCAAT ACGACATCCG CAACCTGCTG 
AGGGGGGCGC GCGCGCTCAA CAACAACGAG CCGTTCCCCG GCGAACGGCT GCTGCATCGT 
CTGCTCGACA ACACCTACTA CGCCCATGTC TTGCCGCCGC TGCCGGAGCA GGAGGACACC 
CTTCGCGAAC GCGCCGAAGC CGAACTGTCG ACGCTGTTGG GCAAGGGAAG CCAGGCGCTC 
GGTGCGGTCG TCGGCTGGCT CGACCGGATG CGGGATGGAC TAAGCGACAC ATCGAAGCAA 
AAGTAA

Protein sequence

MTEPARHPIK PVSGKPPIEA NVGAGFWRKG PADTLPPPDM VGPYMRNRPV PVAPMEGRKA 
WIIGSGIAGL SAAFYLIRDG GMKGEDITIF DTLEIAGGSL DGAGNADEGY IIRGGREMNF 
NYDNFWDVFQ DVPALELPDG YSVLDEYRLV NDNDPNWSKA RLMHKQGQIR DFSTLGLSKL 
HQWEIVKLLL KRKEDLDDIT IEQYFSASFL ETNFWYLWRS MFAFENWQSL LEMKLYMHRF 
IDAIDGLTDM SALVFPKYNQ YDSFVVPLTR LLKEKGVKIQ FGVRAYDLDM VEKAGRRTVT 
AIRCKKAGQN DSIAVGPNDV VFALTGSMTE GTAYGDMNVA PVLARGNAEP GEDSDWTLWK 
NLAKKSPIFG KPEKFYGNVA GSMWESATLT CKASPLVDKL KELSVNDPAS GKTVTGGVIT 
FTDSNWVLSF TCNRQPHFPT QPDDVLVLWV YALLMDKDGN YVQKPMPACT GREILAELCY 
HLGIVDQLDA IAAKTKVRLA LMPYITAQFM PRAAGDRPRV VPEGCTNLAL VGQFVETSND 
VIFTMESSVR TARIGVYTLL GLPKQVADIS PTQYDIRNLL RGARALNNNE PFPGERLLHR 
LLDNTYYAHV LPPLPEQEDT LRERAEAELS TLLGKGSQAL GAVVGWLDRM RDGLSDTSKQ 
K