Gene RPB_4215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4215
Symbol
ID	3912023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4787696
End bp	4788799
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	66%
IMG OID	637886118
Product	ABC transporter related
Protein accession	YP_487817
Protein GI	86751321
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.611478
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCA TTGACCTCGT GGACCTGGCT CACTCCTACC TCGTCGGCGA CGATCTGCCG 
CCGGCTGCCT ATGCGCTGAA GCCGGTATCG ATGACCTGGC GGCAGGGCGG CGCCTATGCA 
CTCCTCGGCC CCTCCGGCTG CGGCAAGACC ACGCTGCTCA ATCTGATTTC CGGCATCGTG 
ACGCCGTCGC GCGGCAAGAT CCTGTTCGAC GGCACCGACG TCACGCGGCT GTCGACCCGC 
GAGCGCAACA TCGCGCAGGT GTTCCAGTTT CCGGTGATCT ACGACACCAT GACGGTGCGG 
GAGAATTTGG CGTTTCCGCT GAAGAATCGC GGCGTGCCGA AGCCTGAGAT CGACAGGCGC 
GTCGCCGAGA TCGCCGATCT GCTCGACCTC ACGCCGAATC TGGGGCGCAA GGCGACGCGG 
CTGACCGCCG ACGCCAAGCA GAAGATCTCA CTCGGCCGCG GCCTGGTCCG CTCCGACGTC 
GCCGCGATCC TGTTCGACGA ACCGCTCACG GTGATCGATC CGCATCTGAA GTGGGAGTTG 
CGCTCCAAGC TGAAGGCGCT GCATCGCGCG CTGGATCTCA CGATGATCTA CGTCACCCAC 
GACCAGACCG AAGCGCTGAC CTTCGCCGAC ACCGTCGTCG TCATGCATGA CGGCCGTGTG 
GTGCAAAGCG GCACGCCGGA GGAACTGTTC GAGAAGCCGG CGCACACCTT CGTCGGTTAC 
TTCATCGGCT CGCCCGGCAT GAACATCGTG CCGGCGCAGA TCCGCGGCCG CGAGGCGCTG 
ATCGACGGCC ATGCGATCAC ACTCGCCCGC GGCTACGACA ATCTGCCATC CGGGGCCAAG 
ATCGAGATCG GGGTGCGGCC GGAATTCGTG CACCTCACCG CGAAGGCGCC GGGGTTTTTG 
TCCGGCCGCA TCGAGCGGAT CGACGACCTC GGCCGCATCC GTTTCGCCTG GGTGCGGGTC 
GGCGGCGTCC GCTTCGCCGC GCGGGTCCCG GACGGATTCT CCGCCGACGG CGACGAGGTC 
GGTCTGATGA TCGAACCGTC GCGCGTCCAC GTCTATGCCG ACAGCGAGAT CGTCGAAGGA 
AGCGCGCTGG AGCAGGTCGC CTGA

Protein sequence

MARIDLVDLA HSYLVGDDLP PAAYALKPVS MTWRQGGAYA LLGPSGCGKT TLLNLISGIV 
TPSRGKILFD GTDVTRLSTR ERNIAQVFQF PVIYDTMTVR ENLAFPLKNR GVPKPEIDRR 
VAEIADLLDL TPNLGRKATR LTADAKQKIS LGRGLVRSDV AAILFDEPLT VIDPHLKWEL 
RSKLKALHRA LDLTMIYVTH DQTEALTFAD TVVVMHDGRV VQSGTPEELF EKPAHTFVGY 
FIGSPGMNIV PAQIRGREAL IDGHAITLAR GYDNLPSGAK IEIGVRPEFV HLTAKAPGFL 
SGRIERIDDL GRIRFAWVRV GGVRFAARVP DGFSADGDEV GLMIEPSRVH VYADSEIVEG 
SALEQVA