Gene RPB_3976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3976
Symbol
ID	3911783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4539177
End bp	4540610
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	67%
IMG OID	637885880
Product	LhaA protein
Protein accession	YP_487580
Protein GI	86751084
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.27032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.197279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA TGGCGGCGAC ATTGGCGAAA GGCTGGATGC GTCTCGGGAC GCGTTTCCTG 
CCGTTCGCCG ACGCGGCGAC GAAAGAGCTC CCGCTCGGCC GTCTGCTGCG CCTGTCGCTG 
TTTCAGGTCT CTGTCGGCGC TTCGGTGGTG CTGCTCAACG GCACGCTGAA CCGGGTGATG 
ATCGTCGAGC TCGGCGTCTC GACGCTGCTG GTCTCGCTGA TGGTGTCGCT GCCACTGATC 
TTCGCGCCGT TCCGCGTGCT GATCGGATTC AAGTCGGACA ACCACCGCTC GGTGCTGGGC 
TGGCGTCGTG TGCCTTATAT CTGGATGGGC ACGATGCTGC AGTTCGGCGG CTTCGCGATC 
ATGCCATTCG CGCTGCTGGT GCTGTCCGGC GGCGGCGAGT ATCCGGCGGT CTATGGTCAG 
ATCGGCGCTG CTCTGGCGTT CTTGCTTGTC GGCGCCGGGC TGCACACGAC GCAGACCGCC 
GGCCTTGCGC TCGCCACCGA TCTGGCGCCG GAAGAATCGC GGCCGCGGGT CGTCGCGTTC 
CTTTACGTGA TGCTGCTCGT CGGGATGACC GGCAGCGCGC TGCTGTTCAG CGAACTGCTC 
CGCGACTTCA GCGAGCTTCA ACTGATCCAG GTGATTCAGG GCGTCGCCGT CGCCCAGTTG 
CTGCTCAACA TCGCTGCGCT GTGGAAGCAG GAGGCGCGCA ATCCCGCGCT CACCTCGGCG 
ACCCGTCCGC GGCCGCAGTT CAATCAATCT TGGGCGCGGT TCCGCGCTGC CGGCGGTTCG 
AACCGGATGC TGGTCGCGGT CGCGCTCGGT ACCGCGGGAT TCTCCATGCA GGACATCCTG 
CTGGAGCCTT ACGGCGCCGA AGTGCTGAAG CTCTCCGTCG GTCAGACCAC GGCGCTGACC 
GCGTTTTTCG CGCTCGGCAC GCTGGCCGGC TTCGGCCTCG CGGCGCGGAC GCTCGGACGC 
GGCAGCGATC CGTATCGGAT CGCCGGCTTC GGCGCGCTGA TCGGCATCTT CGCGTTTGCG 
GCCGTCGCGC TGGCGGCGCC GGCGCAATCG GTTGTTCTGT TCCGGATCGG CACCGCGCTG 
ATCGGGCTGG GCGGAGGCCT GTTCGCGGCC GGCACGCTGA CCGCAGCGAT GCAGATCGGT 
TCCGACAGCG AACCCGGGCT CGCGCTCGGT GCCTGGGGCG CGGTGCAGGC CACCGCGGCG 
GGCGGCGGCA TCCTGCTCGG CGGCGGTCTG CGCGATTTGT TCGCTTCGCT CGCCGACAGC 
GGCATGCTCG GCGCCGTGCT GTCGGGGCCC GCGATCGGTT ACGGCTTCGT CTACAACATC 
GAGATCGCGT TGCTGTTCGC AACGTTGGTT GCGGTAGGTC CTCTCGTGCG GGTCGCACGG 
CCGAACTACG CGCAGCCTTC ATCCAAGTTC GGCCTAGCCG AATTTCCAGG TTAA

Protein sequence

MSQMAATLAK GWMRLGTRFL PFADAATKEL PLGRLLRLSL FQVSVGASVV LLNGTLNRVM 
IVELGVSTLL VSLMVSLPLI FAPFRVLIGF KSDNHRSVLG WRRVPYIWMG TMLQFGGFAI 
MPFALLVLSG GGEYPAVYGQ IGAALAFLLV GAGLHTTQTA GLALATDLAP EESRPRVVAF 
LYVMLLVGMT GSALLFSELL RDFSELQLIQ VIQGVAVAQL LLNIAALWKQ EARNPALTSA 
TRPRPQFNQS WARFRAAGGS NRMLVAVALG TAGFSMQDIL LEPYGAEVLK LSVGQTTALT 
AFFALGTLAG FGLAARTLGR GSDPYRIAGF GALIGIFAFA AVALAAPAQS VVLFRIGTAL 
IGLGGGLFAA GTLTAAMQIG SDSEPGLALG AWGAVQATAA GGGILLGGGL RDLFASLADS 
GMLGAVLSGP AIGYGFVYNI EIALLFATLV AVGPLVRVAR PNYAQPSSKF GLAEFPG