Gene RPB_1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1097
Symbol
ID	3910183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1258733
End bp	1260013
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	637882990
Product	hypothetical protein
Protein accession	YP_484718
Protein GI	86748222
COG category	[S] Function unknown
COG ID	[COG3174] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.122525
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.979079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCGA CGCCGTCTGT TCATAGTCTC GGCCTGCTGC TGCTGTTGAG TTTTTTTCTC 
GGCTTCGCGT TCGAGGATTT CTTCGCGAAG ACCAGCTCCG CACGGCCGGG CGGCATCCGC 
ACCTTCCCGC TGCTCTCGCT CGGCGGCGGC ATCCTTTATC TGTTCGATCC GACACACCTG 
ATCGCCTTCA CTGGCGGACT GCTCGTGCTC GGCGCCTGGC TGGCGATGTT CTACGGCGTC 
CATCTGCGCG AGCGCGACGA GAAAGGCGAG CGCAATGCCG GGCTGGTGGT GCTGCTGCTG 
AACGTGCACG CCTATCTGCT CGGCGCGGTC GCGCTGGCGC TGCCGCATTG GATCGCGGTC 
GGCGTCACCG TGGTCGCGGT GCTGCTGCTG ACCGGGCGCG ACCGGCTGCA CACGCTGGCG 
CGCCGCATCG ACATGAAGGA AATCACCACG GCCGGTCAGT TCCTGATTCT GACCGGTGTG 
GTGCTGCCGC TGCTGCCGGC CGAGCCGGTG ACGACCCTCA CCAGCATCAC GCCGCGGCAG 
GCCTGGCTGG CGCTGACGCT GGTCTGCACC CTGTCCTATG CGAGCTATCT GGCGCAGCGC 
TACTGGCCGC GGGCGGCGCG CGGGCTGTGG ATGCCGGCGC TGGGCGGGCT GTATTCGTCG 
ACGGCCACCA CCGTGGTGCT GGCGCGGCAG GCGAATGCCG ACCCGGCCTC GCGACGGCAG 
GCGCTGGCCG GGATCACGCT CGCCACCGGC ATCATGTATC TGCGCATTCT GGCGATCATC 
GCGGTGTTCA ATCTGGCGCT GGCGCGCCAG CTCGTGGTGC CGATGGCCGG CCTCGCCGCC 
TTGGCGCTGT CGATCGCCGC GCTGCAATAC TGGCTGATCA AGGCGCCGGC CGCCGAAGCG 
CATGACGCAG CGGGGCGCGG CAACCCGCTC GAACTCGGCA CCGCCGCGGC GTTCGCGGCG 
ATGTTCGTGC TGATCTCGCT GGCCTCGACC TGGGTGAAGA CGGAATTCGG CACCGAAGGC 
ATCTATTGGC TGGCGGCGAT CGTCGGCTTT GCCGACATCG ATCCCTTCGT CCTCAATCTG 
GCGCAGGGCG GCACCGCCGG GATCGGCGAC CACGCGGTCG CGATCGCGGT GCTGATCGCG 
GCGTCGTCCA ACAACATCCT GAAGGCGACC TACGCGCTGT CGTTCGGCGG CCGCGCGACG 
CTGCAGAGCG CGCTGATGCT GGTGATACTG GCCGGGATCG GCGTCGTGCT CGCTGTGCTG 
CTCGCGCGCG GGACGCTCTG A

Protein sequence

MIATPSVHSL GLLLLLSFFL GFAFEDFFAK TSSARPGGIR TFPLLSLGGG ILYLFDPTHL 
IAFTGGLLVL GAWLAMFYGV HLRERDEKGE RNAGLVVLLL NVHAYLLGAV ALALPHWIAV 
GVTVVAVLLL TGRDRLHTLA RRIDMKEITT AGQFLILTGV VLPLLPAEPV TTLTSITPRQ 
AWLALTLVCT LSYASYLAQR YWPRAARGLW MPALGGLYSS TATTVVLARQ ANADPASRRQ 
ALAGITLATG IMYLRILAII AVFNLALARQ LVVPMAGLAA LALSIAALQY WLIKAPAAEA 
HDAAGRGNPL ELGTAAAFAA MFVLISLAST WVKTEFGTEG IYWLAAIVGF ADIDPFVLNL 
AQGGTAGIGD HAVAIAVLIA ASSNNILKAT YALSFGGRAT LQSALMLVIL AGIGVVLAVL 
LARGTL