Gene RPB_1013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1013
Symbol
ID	3909137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1161703
End bp	1162944
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	67%
IMG OID	637882906
Product	hypothetical protein
Protein accession	YP_484634
Protein GI	86748138
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACT TTGCCATCGC GGCCGCCCCC TCCCCGGCCA CGGCGCCGCG CCTGCGGGCG 
CTGCAGCTGG CGCTGCTGTG GTTCGTCGGC GCCAGCGGCG CCATCGTGTT CATCGAGCCG 
AGCCCGTATG AATTCGCGAT CCTGCTGTCG ATCGTGGTGT TCTTCGCCTC CGGCCTGCGG 
ATCACGCCGG CGCTGATCGT GCCGATCGCG CTCTTGATCG GCGTCGAACT CGGCTACACG 
ATCGGCGCCA GCTCCCTGCT CGACGATCCG ATCATCCTGA ACTGGCTGCT GACCTCCTGG 
TACATGGCGA TCACCGCGAT GTTCTTCGCG CTGGTGACGC TGGAGCACAC CGGCGACCGG 
ATCGAGGCGC TGGCCAAGGG CTATCTGATC GGCGGGCTGA TCGCGTCGCT GGCCGGCATC 
GCCGGCTATT TCAACCTGAT CCCCGGCACC ACGGACCTGC TGACCTATGC GGGGCGCGCC 
CGCGGCACCT TCAAGGACCC GAACGTGCTC GGCGCGTTCC TGATCTTTCC GGCGGTCTAC 
GCGCTGCAGC GGGTGATCGA GGGCTCGTTC TGGAGCGCGA TGCGCCATGC GATCGCCTTC 
GGCATCATCG CGCTGGCGAT CTTTCTGGCG TTCTCGCGCG CCGCCTGGGG CACGCTCGCC 
GGCGCCTCGA TGCTGATGAT CGCGCTGATG TTCGTCACCG CGCCGACGCA GCAGCGGCGA 
TTGCGGATCG TGATGCTGGC GGCGATCGCC GGGCTGGTGC TGGTCGCCGC CATCGCGGTG 
CTGCTGTCGT TCGACCGGAT CGACGCGCTG TTCAAGGAGC GCGCCAGCTT CTCGCAACCC 
TACGACAGCG GTCGGTTCGG GAGGTTCGGC CGGCATCTGC TCGGCGCCGG CATGGCGCTG 
GACTATCCGA CCGGAATCGG CCCGCTGCAG TTCCGGCGGT TCTTTCCCGA GGACACCCAC 
AATTCGTTCC TCAACGCCTT CATGTCCGGC GGCTGGATCA GCGGCATCCT GTATCCGGCC 
CTGGTGTTCA TCACCGCCGC CTACGGGCTG CGCAACGTTT TCGTCCGCAC GCCGTGGCAG 
CGCACCTACA TCGCCATCGT GGCGACGCTG ATCGTGACGC TGCTGGAAAG CTTCATTATC 
GATACCGATC ACTGGCGGCA TTATTTCATG CTGATCGGCT TGACCTGGGG CGTGGCAATT 
GCGAGCAGTC GCCTCCGGTT GCAGAGCCAC GCCGGGCCCT GA

Protein sequence

MTDFAIAAAP SPATAPRLRA LQLALLWFVG ASGAIVFIEP SPYEFAILLS IVVFFASGLR 
ITPALIVPIA LLIGVELGYT IGASSLLDDP IILNWLLTSW YMAITAMFFA LVTLEHTGDR 
IEALAKGYLI GGLIASLAGI AGYFNLIPGT TDLLTYAGRA RGTFKDPNVL GAFLIFPAVY 
ALQRVIEGSF WSAMRHAIAF GIIALAIFLA FSRAAWGTLA GASMLMIALM FVTAPTQQRR 
LRIVMLAAIA GLVLVAAIAV LLSFDRIDAL FKERASFSQP YDSGRFGRFG RHLLGAGMAL 
DYPTGIGPLQ FRRFFPEDTH NSFLNAFMSG GWISGILYPA LVFITAAYGL RNVFVRTPWQ 
RTYIAIVATL IVTLLESFII DTDHWRHYFM LIGLTWGVAI ASSRLRLQSH AGP