Gene RPB_0308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0308
Symbol
ID	3908687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	348932
End bp	350176
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	637882192
Product	twin-arginine translocation pathway signal
Protein accession	YP_483930
Protein GI	86747434
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.263961
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCATCA ATTGCGGAAA TGACATCGTT CATGCCGATG ACGATCGCTT CCGGTTCGCG 
ATCAACCGCC GGCAGACGCT CGACATGCTC GCCGCCGGCG GCCTCGCCGC GCTCGGCACC 
ATGCTGGGCG GCTTCGGCCA ATCCGCACGC GCGGCCGACG ACGACGTCGT CCGCATCGGC 
TATCTGCCGA TCACCGACGC CACCGCGCTC CTGGTCGCGC ACGGCATGGG CTACTTCAAG 
GACGAGGGTC TCGAGGCCGA GCGCCCGACG CTGATCCGCG GCTGGTCGCC GCTGGTGGAG 
AGCTTCGCGG CCGGCAAGTT CAACCTGGTG CATCTGCTCA AGCCGATCCC GGTGTGGATG 
CGCTACAACA ACAACTTCCC GGTCAAGATC ATGGCCTGGG CCCACACCAA CGGCTCCGGC 
GTCGTGGTCG GCGGCGAGAG CGGCATCGCG TCGTTCAAGG ATTTCGGCGG CAAGCAGGTC 
GCGGTGCCGT TCTGGTACTC GATGCACAAC ATCGTGCTGC AATACGCGCT GCGCAAATCC 
GGCATCAAGC CGGTGATCAA GGGCCAGGGC GAGACGCTCG CGGCCGACGA GTGCAATCTG 
CAGGTGATGG CGCCGCCCGA CATGCCGCCG GCGCTCGCGG CCAAAAAGAT CGACGCCTAC 
ATCGTCGCCG AGCCGTTCAA CGCGCTGGGC GAAACCAAGG CCGGCGGCCG GATGCTGCGC 
TTCACCGGCG ACATCTGGAA GAATCACCCC TGCTGCGTGC TGTGCATGAA CGAGGAGGTG 
ACCAGAAAGA AGCCGGAATG GACCCAGAAG GTGATGAACG CCCTGGTCCG CGCCGAGATC 
TACGCCAGCG CCAACAAGAA GGAAGTCGCC AAGCTGCTGT CGAAGGACGG CGAAGGCTAT 
CTGCCGCTGC CGGCGCCGGT GATCGAGCGC GCGATGACTT ACTACGACGA CAAGACCTAT 
GGCGAGAGCG GCGCCATTAC CCATCCGGAC TGGAAGCTCG GCCGGATCGA CTTCCAGCCC 
TGGCCGTATC CGTCGGCGAC CAAGCTGATC GTCGGCGCGA TGAACGAGAC GGTGGTCTCG 
GGCGACACCA CCTTCCTGAA GAAGCTCGAT CCGGAATTCG TCGCCAAGGA TCTGGTCGAC 
TATCACTTCG TCAAGCAGGC GATGACGAAG TACCCGGACT GGAAGACATC GCCGAGCGTC 
AATCCCGACG ATCCGTTCGC CCGGACCGAG GTGCTGTCGC TGTGA

Protein sequence

MCINCGNDIV HADDDRFRFA INRRQTLDML AAGGLAALGT MLGGFGQSAR AADDDVVRIG 
YLPITDATAL LVAHGMGYFK DEGLEAERPT LIRGWSPLVE SFAAGKFNLV HLLKPIPVWM 
RYNNNFPVKI MAWAHTNGSG VVVGGESGIA SFKDFGGKQV AVPFWYSMHN IVLQYALRKS 
GIKPVIKGQG ETLAADECNL QVMAPPDMPP ALAAKKIDAY IVAEPFNALG ETKAGGRMLR 
FTGDIWKNHP CCVLCMNEEV TRKKPEWTQK VMNALVRAEI YASANKKEVA KLLSKDGEGY 
LPLPAPVIER AMTYYDDKTY GESGAITHPD WKLGRIDFQP WPYPSATKLI VGAMNETVVS 
GDTTFLKKLD PEFVAKDLVD YHFVKQAMTK YPDWKTSPSV NPDDPFARTE VLSL