Gene RPD_3939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3939
Symbol
ID	4024455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4378341
End bp	4379585
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	60%
IMG OID	637964143
Product	MobA/MobL protein
Protein accession	YP_571061
Protein GI	91978402
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATAT TTAGCCTGAA CCACAGCTTC ATTGGCCGGA CTACCGACCC AAAAGGCTCG 
GCAAGTCTTT TTGCGCGCTA CATTACTCGG CCCCAAGCCT GCACCGAAGT CGTCGGCGAG 
CGCATGCCGC TTGATCGCGC AGCCATGATG CGCTGGCTCG ACGGGCAGGA ACAAAAAGAC 
CGCCGAATTG CCCGGGTGAT CGACAAGGTC GTGGTCGCCC TCCCCATCGA ATTAACCCAT 
GAGCAAAATG TGGAATTGCT CCAGGGCTTC TGCGAGCGAA TGACCCAGGG CAGTGCCTCT 
TGGGCCGCTG CGGTCCATGA CGGCCCTGAC GACCTGGACA ACCCTCACGC CCATATCATC 
TTCCGGGACC GAGACTGGCA CACCGGCAAG CGGGTGATGC TGACAACGGA GCAAGGCAGC 
ACCCAGCGCT TCAGGGATGC GTGGGAGGAC GAGGTCAACC GCGCGCTCGA ACATGAAGGC 
TTTGAGACAC GGATCGATAA GCGCAGCCTA AAGGAGGACC AAGGCGTCGA CCGCGAGCCG 
CAACTCCATG TCGGCGCTGC CTCGAAGTAT CTTCACGGCA AGGAGCATGA ATTCCGCAGC 
GAAGAGAAGC AAACTACCCG CATGATTGAC GGCGTGCCCG TGCAAGTCAT CGTCAACTAC 
CCCGCGATCG ACGAGGGCAA GACCCGCTTC CAGGAGAACG AGGATCGCAA GACGCGGAAT 
GCCGAGCAGG AGCGTGCGAT GGCAGGCATC TTTGCGGCAG AGCGCGAACT CCACAATATC 
TATGTGAAGG CGAGCAAATC CGGCACGCCA CCCGACGATC CGAGCGATCC GCTCGCCACC 
ATCGTCGCCT TCCACATGCG GGATGCCACC CGGACTGAGG AGCAGCGCGA GAAGTATGAG 
CTGTGGACGT GGCGCCCGCT CCAAAACAAC ATCGGCAAGC CCTTCGAGCC GGCGAGCAAG 
CTCAAAGTTC CAAGCGACAT GGTCGCCGGA GCCGGCCTCT CCATCGTCGG CAAGATCGCC 
AAGTCACTGG AATCAATTTT TGATGGACCC CAACGGGACC CAGAGGACAC GGAGCAAAAC 
ATGGCCGAAA GGCAAGTCAC ACCACAGCAG CAGCGTGTCG AAGCTAACCT GCGTGAGCAG 
GCGCAGCGCA CGCATGAAGC CGACATCGCC AAGTGGCGGC AGAAGGAGTT GGATGCGTAT 
CTAGACCAGC GGGATAAAGA ACGGCACATG GACCGAGGTA GATGA

Protein sequence

MAIFSLNHSF IGRTTDPKGS ASLFARYITR PQACTEVVGE RMPLDRAAMM RWLDGQEQKD 
RRIARVIDKV VVALPIELTH EQNVELLQGF CERMTQGSAS WAAAVHDGPD DLDNPHAHII 
FRDRDWHTGK RVMLTTEQGS TQRFRDAWED EVNRALEHEG FETRIDKRSL KEDQGVDREP 
QLHVGAASKY LHGKEHEFRS EEKQTTRMID GVPVQVIVNY PAIDEGKTRF QENEDRKTRN 
AEQERAMAGI FAAERELHNI YVKASKSGTP PDDPSDPLAT IVAFHMRDAT RTEEQREKYE 
LWTWRPLQNN IGKPFEPASK LKVPSDMVAG AGLSIVGKIA KSLESIFDGP QRDPEDTEQN 
MAERQVTPQQ QRVEANLREQ AQRTHEADIA KWRQKELDAY LDQRDKERHM DRGR