Gene RPB_3660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3660
Symbol
ID	3911462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4201767
End bp	4202765
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	64%
IMG OID	637885562
Product	AraC family transcriptional regulator
Protein accession	YP_487266
Protein GI	86750770
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.954099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGCGA GGTCTGCTTT GCAGAGAGTT GTGTACAGCG CCCATGATTT GTCGCCCGGG 
CTCGACGACC AGGCGCGGTT CTCGCGGTGG CGCGATATCT ACACGGCCAG TTTCCTGCAG 
AGCGGCAACG TGGTCCGATT ATCCGACAGG CCGTTCGCTG CGACCTGGGA GCACGCCCAG 
ATCGGCGATA GTCTGGTGGC GCGTTTCGAA GGCACGTTGC AGCGCGTATC ACGCGATGCC 
CAGCAGGTTG CGGCGCATCC GGTGGACAGA TTCTGCATCA GCTACAATCG GGCGTCGTCG 
CGGCAGGCAA TGGTCCAGCG CGGCAGGGAA CTGACGCTGG AGCCGGGGAC GCCGGCCTTT 
TTCAATCTGT CGGAGATGCT CGACTGCCGC TCCGAGCACG GCGAGGCCCG GATCGGATTC 
ACCCTGCCGC GCAAGACATT GCTGGATAGC ATTCCGCATG CGGAAGATCT GGTGTTGCGA 
CCGCTCGACC CGGGCGACGA CGCGCTGCTG CACCTGCGCT GGTATCTCGA CTTCCTGCTC 
GAACGAGACG GTGCCGCGCT CGATCCGGCG ATGGTCGCGC ATGTGCAATC GGTCTTAATC 
GATCTGCTCG GTCTCGCGCT CGGCGTCGGT CGCGATCTTG CAGAGGCCTC GAAACTGCGC 
GGGCTGCGCG CTGTGCGTTT TATGACCATC GTCGCGGAGA TCGGGGCCGG CTTCGCCGAT 
CCAGGATTTT CGGCGGCGCG GCTTGCCGCG AAGCTCAACC TGTCGTCGCG TTATATCCAG 
GACATCCTGC ACGAAAGCGG GGTGACCCTG ACCGAGCGGG TGCTCGAGCT GCGGCTGCAG 
AAGGCCCGCA GATTGCTGGC ATCCGGCCTG TCGCCCGCCT TGAAAGTCAC CGATATCGCG 
CTGAGTTGCG GCTTCAGCGA CGTCTCCCAC TTCAACCACA GCTTCCGCCG CCGGTTCGGC 
GCGTCGCCGA CCCAATTCCG GCCGCCGCGC ATCAACTAG

Protein sequence

MRARSALQRV VYSAHDLSPG LDDQARFSRW RDIYTASFLQ SGNVVRLSDR PFAATWEHAQ 
IGDSLVARFE GTLQRVSRDA QQVAAHPVDR FCISYNRASS RQAMVQRGRE LTLEPGTPAF 
FNLSEMLDCR SEHGEARIGF TLPRKTLLDS IPHAEDLVLR PLDPGDDALL HLRWYLDFLL 
ERDGAALDPA MVAHVQSVLI DLLGLALGVG RDLAEASKLR GLRAVRFMTI VAEIGAGFAD 
PGFSAARLAA KLNLSSRYIQ DILHESGVTL TERVLELRLQ KARRLLASGL SPALKVTDIA 
LSCGFSDVSH FNHSFRRRFG ASPTQFRPPR IN