Gene RoseRS_4010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4010
Symbol
ID	5210993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5017108
End bp	5018319
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	62%
IMG OID	640597599
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001278305
Protein GI	148658100
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000079745
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGAC GAGTGTTTCT TCGCAGCGTC GCGGCGGGCA GCGCAGCCCT GACAGCAGCC 
ACACTGGCAG CGTGTGGTCA GGCGCCGCAG ACGCCAGTTC AGCAGGCGAC GACCGCCCCG 
GCACAGCAGG CGACGACCGC CCCGGTACAG CAGGCAACGC AGGCGCCGGT CGCCACTGCG 
CCACAACCGC AGGCGCCAGC GCAAACGAGC GAGATGCCCT CTCTTGAGTG GGATATGGCT 
ACCAGCTGGC CCGTGGCGCT CGACACGATT TTCGGCGGAG CGAAGACAGT TGCTGACCGT 
GTGGCGGCAT TGACAGACGG TAAGTTTAAA ATCACGCCAC GCGCTGCGGG CGAACTGGCG 
CCTGCCTTGC AGGTGCTTGA TGTGGTGCAG CAGGATGCCG TGCCGATCGG TCACACCGCA 
TCGTACTACT ATGTCGGCAA GAGTCCGGTG ACCGCGTTTG GCACTACGGT GCCCTTCGGT 
CTCAACGCAC AGCAGCAAAA TGCCTGGTTG TACGACGGCG GCGGGCTGGA AAAATTGCAG 
GCGGTGTACG CCAAACTGTT CAATGTTATT CAGTTCCCGG CGGGCAATAC CGGCGTCCAG 
ATGGGTGGGT GGTTCCGCAA GGAGATCAAC ACCGTCGCCG ACCTTCAGGG TCTCAAGATG 
CGCATCCCCG GTCTCGGCGG GCAGGTGTTG ACCAAACTGG GAGTCACCGT TCAGGTCATT 
CCGGGTGGTG AGATCTTCCA GGCGTTGCAG ACCGGCGCGG TCGACGCGGC GGAATGGGTC 
GGGCCGTATG ACGATGAGAA ACTCGGACTG AACAAGGCGG CGAAGTTCTA CTACTATCCG 
GGCTGGTGGG AGCCGGGTCC TACACTCGAG GTGCAGGTCA ACCTCGACAG GTGGAACGAA 
CTGCCAAAAG TCTACCAGGA GGCGATTAAG ACCGCATCCG CCGAGGCGAA TATCACGATG 
CTGGCGCGGT ACGATGCGCG CAACCGTGAA GCGCTCAAGC GCCTGGTGGA CGGCGGCGCG 
CAACTGCGCC CGTACAGCAA GGAAATCCTT GCCGCAGCCG AGAAAGCCGC CTTCGAACTG 
TACGATGAGT TCGCCGCGAA AGACGCCGAC TTCAAGGAAA TCTACGAGGA GTGGAAGGCG 
TTCCGCGAGG CCATCTATGA GTGGAACAAG GTGAACGAAG CCGGGTACAC CAACTACGCC 
TACAATAAGT GA

Protein sequence

MRRRVFLRSV AAGSAALTAA TLAACGQAPQ TPVQQATTAP AQQATTAPVQ QATQAPVATA 
PQPQAPAQTS EMPSLEWDMA TSWPVALDTI FGGAKTVADR VAALTDGKFK ITPRAAGELA 
PALQVLDVVQ QDAVPIGHTA SYYYVGKSPV TAFGTTVPFG LNAQQQNAWL YDGGGLEKLQ 
AVYAKLFNVI QFPAGNTGVQ MGGWFRKEIN TVADLQGLKM RIPGLGGQVL TKLGVTVQVI 
PGGEIFQALQ TGAVDAAEWV GPYDDEKLGL NKAAKFYYYP GWWEPGPTLE VQVNLDRWNE 
LPKVYQEAIK TASAEANITM LARYDARNRE ALKRLVDGGA QLRPYSKEIL AAAEKAAFEL 
YDEFAAKDAD FKEIYEEWKA FREAIYEWNK VNEAGYTNYA YNK