Gene RoseRS_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1089
Symbol
ID	5208036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	1353510
End bp	1354598
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	63%
IMG OID	640594703
Product	GntR family transcriptional regulator
Protein accession	YP_001275447
Protein GI	148655242
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.126635
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGACA CCATCATTTT CACCCGTGGC GTTCCGCCAG CCGAAGCATT TCCAACCGCG 
CAGATCGCCG AATGTCTGGC GACGGCAGTC GAGACGGATG CGGCAGTCGT TCTCCAGTAC 
GGTCACCAGC CCGGCTATGC ACCGCTACGG GCGCTGCTCG CCGCCGACTA CGGCGTGAAG 
GACAACGAAA TCATGGTCGC CAATGGATCA TTGCAGTTGC AGGATCTGCT GGCGGCGCAT 
CTGGTGCGTC CAGGGACGAC GGTGCTGACC GAACAGCCCA GTTACGACCG CGCCATTACG 
ACGTTTCGCC GTCGTGGTGC GCGGGTGGTC GGTATTCCCC TCGAAGCCGA TGGGCTTGAC 
GTGGCGCGTC TCGAAGCCGA GGTCAAACGG CAGACCCCGG CATTCCTCTA CACGGTTCCC 
GATTTCCAGA ACCCGGCCGG GGTGACGACA TCGCTGGAAA AGCGGCGCGC AATTCTGGAC 
ATCGCCGAAC GGTATGGCTT CTGGGTGATC GAGGACATTC CGTATCGATT GCTGCGCTAC 
CGTGGCGAGA GCGTGCCGAT GATGCGCGCG ATCAATCCCG GACGGGTGAT CACCATCACA 
TCGTTCAGCA AACTTCTCAG TCCTGGCATG CGCGTCGGCT ATCTGGTGGC GCCGTCGTCG 
CTGGTGGCGG CGGTGACGAA GGAAGCGGAG AACACGTATC TTTCGCCGGT GCTCCCGACG 
CAGGCAGCAG TTGCAGAGTT TATCCGGCGC GGCTGGATGG CGCCGAACAT CGAGCGGCTG 
AAAGAACTCT ACCGCCCCCG CTGGGAAGCG ATGATGAACG CGGTGCGGCG CTACCTGAGC 
GGCGTCGCCG CTTCCGAACC GGATGGCGGC TTCTTCATCA GCGTCACCCT GCCGGCTGAT 
GCCAATACCC GCAACCTGGT TGCACGCGCG AAGGAGATCG GTCTGGTATT GACCGAAGGG 
CAGGCGTTCT TTGCCGACCC TGACGAAGGT CCGGCGCCGG ATGGCGAACG CTTTGTTCGG 
CTGCCGTTCT GCGCGGTGAC GCCGGAGCAG ATCGACGAGG GCGTGCGCCG ACTGGCGTCG 
CTGCTGTAA

Protein sequence

MHDTIIFTRG VPPAEAFPTA QIAECLATAV ETDAAVVLQY GHQPGYAPLR ALLAADYGVK 
DNEIMVANGS LQLQDLLAAH LVRPGTTVLT EQPSYDRAIT TFRRRGARVV GIPLEADGLD 
VARLEAEVKR QTPAFLYTVP DFQNPAGVTT SLEKRRAILD IAERYGFWVI EDIPYRLLRY 
RGESVPMMRA INPGRVITIT SFSKLLSPGM RVGYLVAPSS LVAAVTKEAE NTYLSPVLPT 
QAAVAEFIRR GWMAPNIERL KELYRPRWEA MMNAVRRYLS GVAASEPDGG FFISVTLPAD 
ANTRNLVARA KEIGLVLTEG QAFFADPDEG PAPDGERFVR LPFCAVTPEQ IDEGVRRLAS 
LL