Gene RoseRS_2027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2027
Symbol
ID	5208989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2513557
End bp	2514708
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	62%
IMG OID	640595633
Product	GntR family transcriptional regulator
Protein accession	YP_001276362
Protein GI	148656157
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0905518
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCTA TCGTTCAACT CGTTCATCGA CCCGGCATTC TCGATCTTGG TTGGGGGCAC 
CCCGACCCCG CGGCATTACC GGTGGCAGCG CTCCGGCGCG CGACGGATGC GACGCTGACG 
CGCTACGGCG CCGATGCGCT GGCGTATGGC GCAGAGCGTG GACCTGGACC GCTGATTGAA 
TGGATCTGCG CGCGCCTGGC GCACATCGAT GCACGCCATC CCGACCCCAC AGAGGTGCTG 
ATTACATCGG GCGCATCGCA GGCGCTCGAT CTCCTCTGTA CGCTCATCGC TGCACCCGGC 
GATACGGTGC TGGTCGAATC GCCGACGTAC CACCTGGCGG TGCGCATTCT GCGCGACCAT 
CCATTACACC TGGTCGCCGT TCCATCCGAT GCCGACGGTA TCGATGTGGA AGCGCTGACG 
ATCATCCTGA GGCAACTGGC GAAGCGCGGC AGACAGGCGC GTATGCTCTA TTTCGTTCCC 
ACCTATCACA ACCCAACCGG CGTTTGCCTG AGCCTGGAAC GCCGTAGGGC GCTGGCAATG 
ATTGCCGCCG AGCATGGGTT CGTTCTGGTC GAGGACGATG TGTACCGCGA ACTGAGTTAC 
GATGCGCCTG CGCCGCCGTC GGTGTGGAGC ATCGCACCAC CGGGTGCAGT GGTGCGGATC 
GCATCGTTCT CGAAATCGCT GGCGCCAGGA CTCCGCCTTG GTTACCTGAC CGCCGATGCA 
TCGTTGACCA GACGGTTAAT CGGCAGCGGC TTACTGGACA GTGGCGGAGG AGTCAATCCA 
TTCACAGCGC TCACCGTCGC CGAAGTGTGC GCTACGGGTG ATTTTGAGGC GACAGTAACA 
CAGTTGCGTG CGATGTATCG GGAGCGACGC GATGCACTGG CGCAGAGCCT GCGTATGTAT 
CTGCCACCCG GATGCCGATT CACCGTGCCG GGCGGCGGAT TCTTTCAGTG GGTGGAATTG 
CCGGAAGGGG TCGATGCGGC AACCCTGCTG CCACGCGCTG AACAGACAGG CGTCTCCTAT 
CTTCCCGGAT CACGCTTCTA TCTCGATGCA GCGCGATCCA ACACACTGCG TCTCTCATTC 
AGCCTGTATC CGCCGCACCA ACTGACCGAA GCAGCGCGAC GATTGGGAGA AGCGCTTGCA 
GCGATCAGGT GA

Protein sequence

MLPIVQLVHR PGILDLGWGH PDPAALPVAA LRRATDATLT RYGADALAYG AERGPGPLIE 
WICARLAHID ARHPDPTEVL ITSGASQALD LLCTLIAAPG DTVLVESPTY HLAVRILRDH 
PLHLVAVPSD ADGIDVEALT IILRQLAKRG RQARMLYFVP TYHNPTGVCL SLERRRALAM 
IAAEHGFVLV EDDVYRELSY DAPAPPSVWS IAPPGAVVRI ASFSKSLAPG LRLGYLTADA 
SLTRRLIGSG LLDSGGGVNP FTALTVAEVC ATGDFEATVT QLRAMYRERR DALAQSLRMY 
LPPGCRFTVP GGGFFQWVEL PEGVDAATLL PRAEQTGVSY LPGSRFYLDA ARSNTLRLSF 
SLYPPHQLTE AARRLGEALA AIR