Gene RPB_3419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3419
Symbol
ID	3911221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3908164
End bp	3909408
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	67%
IMG OID	637885322
Product	pyrroloquinoline quinone biosynthesis protein PqqE
Protein accession	YP_487026
Protein GI	86750530
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR02109] coenzyme PQQ biosynthesis protein E

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.058581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.446493
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG CGAGGAACGA GACGATTCAC GCTGCCGACG GCGTCGCCGT GCTGGAGTCG 
CGCGGCTCGG TCGCGGAGAA TTTCGGCATT CCGCTCGCGG TGCTGCTGGA GCTGACGCAT 
CGCTGTCCGC TGCAATGTCC GTACTGCTCG AATCCCGTGG AGCTCGAGCG CGGCGGCGCC 
GAACTCACGA CCGACGAGTG GAAGCGCGTG CTCGGCGAAC TCGCCGCCAT CGGCGTGCTG 
CAGGTGCATT TTTCCGGCGG CGAGCCGACC GCGCGCAAGG ACCTCGTCGA GCTGGTGCGA 
CACGCCAGCG ACGTCGGGCT GTACACCAAT CTGATCACCT CGGCGGTGCT GCTGACGCGC 
GAGCGCCTCG CGGCGCTGGC CGATGCCGGG CTGTGCCATG TCCAGATCAG CTTTCAGGGC 
TACGAACCTG TCGTTGCCGA TCGCGTCGCC GGATTCGCGA ACGGCCATGC GAAGAAGATC 
GAAGCCGCCC GCTGGACCCG CGAACTCGAT CTGCCGCTCA CCGTCAATGC GGTGATGCAC 
CGCCAGAACC TGCATCAATT GCCGGACATC ATCGACATGG CGGTGGCACT CGACGCCGAC 
CGGCTCGAAG TCGCCAATGT GCAGTATTAC GGCTGGGCGC TGAAGAACCG CGCCGCGCTG 
ATGCCGACGC TGCAGCAGAT CGATGACTGC ACCGCGATCG TGGAGGCCGC GCAGTCGCGG 
CTGAAGGGGC AGCTCGCGAT CGACTACGTC GTGCCGGATT ACTACGCGCT GCGGCCGAAG 
ACGTGCATGG GCGGCTGGGG CCGGCAGTTC TTCAACATCT CGCCGAGCGG CAAGGTGCTG 
CCGTGCCACG CCGCCGAGAC CATCACCGGG CTCGCCTTCG ACTCGGTGCG TGGAGGCGCG 
TCGATCGCCG AGATCTGGCG CAATTCCGAG GCGCTGAACC GCTATCGCGG CACCTCGTGG 
ATGCAGCAGC CCTGTGCGAG CTGCGCCTTC AAGGAGATCG ATTTCGGCGG CTGCCGCTGC 
CAGGCCTTCG CGCTCGCCGG CGACGCCGCC GCGACCGATC CGGCCTGTGC ACTGTCGCCG 
CTGCACAAGC GGATCTTCAA GACTGCGGAA GCAGAGGCGG AAGCCGGGGG CGACAAATTC 
GTGTATCGCA ATTTCGCCGG CGGCACGGCG GAGGGTCGTA GCACCACCTC ACCACGTCAT 
TCCGGGGCGC GCACAGCGCG AACCCGGAAT CTCGCGGTGC CATGA

Protein sequence

MSAARNETIH AADGVAVLES RGSVAENFGI PLAVLLELTH RCPLQCPYCS NPVELERGGA 
ELTTDEWKRV LGELAAIGVL QVHFSGGEPT ARKDLVELVR HASDVGLYTN LITSAVLLTR 
ERLAALADAG LCHVQISFQG YEPVVADRVA GFANGHAKKI EAARWTRELD LPLTVNAVMH 
RQNLHQLPDI IDMAVALDAD RLEVANVQYY GWALKNRAAL MPTLQQIDDC TAIVEAAQSR 
LKGQLAIDYV VPDYYALRPK TCMGGWGRQF FNISPSGKVL PCHAAETITG LAFDSVRGGA 
SIAEIWRNSE ALNRYRGTSW MQQPCASCAF KEIDFGGCRC QAFALAGDAA ATDPACALSP 
LHKRIFKTAE AEAEAGGDKF VYRNFAGGTA EGRSTTSPRH SGARTARTRN LAVP