Gene RPB_2542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2542
Symbol
ID	3910331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2911187
End bp	2912518
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	65%
IMG OID	637884440
Product	hypothetical protein
Protein accession	YP_486157
Protein GI	86749661
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.15406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGCA CCACGAAGAA GATCAAGCCC AAGGAGCGGG ACACGATCAT TCAGGCGCTA 
TCCGCCGGTG TCGTGCCGAG GCTCGGGTTG CCGTACATCC AGGTCGGGCG CGCCGCCGAG 
ATCGCCGCGC TGCTGCGGGA CGTCGATCGT ATCGGCGACG GCGGGGCCTG CGTACGCTTC 
GTGATTGGCG AGTACGGCGC CGGCAAAACC TTCTTCGCCA ATCTGATCCG GCTGATCGCA 
CTTGAACGGA AGTGCGTCAC GATCCATGCG GATCTGGCGC CTGACCGCCG CATCCACGCG 
ACCGGTGGCC AGGCGCGCGC GCTGTATTCG GAGGCTGTCC GAAACATGGC GACCCGGACG 
AAGCCCGAGG GAGGCGCGCT GGCCGGCGTC GTGGAGCGCC TTGTCACCGA TTCCGTGAAG 
GAGGCGGCGG AGCGCAGCAT CCCGGTCGAG ACCGTGATCG ACCAGAAGCT GGCGCCGATC 
CAGGAGTTCG TCGGCGGCTA CGACTTCGCG GTCGTGCTGA AGGCGTACTG GAAGGGAAGC 
GAGGAGGGCG ATGAGGAGCT GAAAGCGGCG GCGCTGCGCT GGCTCCGCGG AGAGTTTTCC 
ACCAAAACGG AGGCGCGCCA AGCGCTTGGG GTTCGCACCA TCATCGACGA CGGCGACATC 
TACGACAGCC TGAAGTCTCT GGCTTGTCTG ACCCGCATCG CTGGCTACGC CGGACTGGTG 
GTGATGTTCG ATGAGATGGT CAATCTCTAC AAGCTTCAGA GTTCGCAGGC GCGCAACCAA 
AACTTTGAGG AGATCCTCCG GATCGTGAAC GACGCGCTCC AGGGCAACAC GTCGGGCATC 
GGCTTCGTGA TGTGCGGGAC CCCGGAATTC CTGATGGATA CGCGGCGGGG TCTATACAGC 
TACGAAGCCC TCCAGTCCCG TCTGGCCGAG AACCGCTTCG CCACCGGCGG TCTCGTGGAC 
TACAGCGGCC CGGTCCTCCG GCTTCAGAAT CTGACGCCGG AGGACATGAT GGTCCTGCTG 
ACCAACATCC GCGCGGTCTT CGCCGGCGGC GATCCGGAGA GATTCCTGGT GCCGGACGAG 
GCGCTGCACG CCTTCATGGA TCACTGCAAC AAGCGCATCG GAGAAGCCTA CTTTCGGGCG 
CCCCGGACGA CCGTGAAGGC GTTCGTGCAG ATGTTGTCGG TGCTGGAGCA GAACCCGACC 
GCGAAGTGGC AGGATCTCCT GGGGCAGGTC GAGGTCGCCC CGGACGCTCC TGATACCCAG 
CCGACCACGG AAGGCGAGAC GTCCAACTCG GGCGAGGAGG GTGATGAGCT CACCAAGCTT 
CGCCTCCCTT GA

Protein sequence

MTSTTKKIKP KERDTIIQAL SAGVVPRLGL PYIQVGRAAE IAALLRDVDR IGDGGACVRF 
VIGEYGAGKT FFANLIRLIA LERKCVTIHA DLAPDRRIHA TGGQARALYS EAVRNMATRT 
KPEGGALAGV VERLVTDSVK EAAERSIPVE TVIDQKLAPI QEFVGGYDFA VVLKAYWKGS 
EEGDEELKAA ALRWLRGEFS TKTEARQALG VRTIIDDGDI YDSLKSLACL TRIAGYAGLV 
VMFDEMVNLY KLQSSQARNQ NFEEILRIVN DALQGNTSGI GFVMCGTPEF LMDTRRGLYS 
YEALQSRLAE NRFATGGLVD YSGPVLRLQN LTPEDMMVLL TNIRAVFAGG DPERFLVPDE 
ALHAFMDHCN KRIGEAYFRA PRTTVKAFVQ MLSVLEQNPT AKWQDLLGQV EVAPDAPDTQ 
PTTEGETSNS GEEGDELTKL RLP