Gene Rxyl_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_0213
Symbol
ID	4117840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	213621
End bp	214961
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	638035004
Product	twin-arginine translocation pathway signal
Protein accession	YP_643003
Protein GI	108803066
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGGCGGA GAGAGGAGGG AGGTTCCCTG GTGCGCGGGA GAGCGCTCTT CAGCAGGCGG 
GAGTTCCTCA GGCTCGGCGG GGCCGGGGTG GCCGGGGCGG CGCTGCTCGG GGTCGCGGGC 
TGCGGCGGCG GGGGAGAGCA GGGGGGGCCG GTGCAGCTGG TCTTCTCCCA CGGGCCCGAG 
CAGTCCGGCG TCCTCAGAGA GCAGCTGGAC GCCTTCAACC GGCGGCACGA GGGCGAGATC 
CGGGTCGAGT GGCGGGAGAT GCCGGCCCAG ACCGAGCAGT ACTTCGACCG CCTCAGAACC 
CAGTTCCAGG CCGGCGGGGG GGATATCGAC ACCATAAGCG GCGACGTGAT CTGGCCGGCC 
CAGTTCGCGG CGAACGGCTG GATCGTGGAC CTCTCCGACC GCTTCCCCGA GTCCGAGAGA 
GAGAAGTTCC TCGACGGCCC CATAAACTCC AACGTCTACG AAGGGGCGAT CTACGGGGTC 
CCCTGGTTCA CCGATGCGGG CATGCTCTAC TACCGCAAAG ACCTCCTGCA GAAGAGCGGG 
TACTCGGAGC CGCCCAGAAC CTGGGACGAG CTCAAGGAGA TGGCACTGCG CGTCAAGCAG 
GACTCCGGGA CCAAGTTCGG TTTCGTCTTC CAGGGGGCGA ACTACGAGGG CGGGGTGGTG 
AACGGTCTCG AGTACATCTG GACGCACGGG GGGGATGTGC TGGACCCGGA GGACCCCACG 
AAGGTCATCA TAGACAGCCC CGAGTCGGTG GCGGGGCTGA AGACCGAGCG GAGCATGGTG 
GAGGAAGGGG TGGCGCCAGA GGCGGTGGTC AACTACGCCG AGATGGAGTC GCACACCGCC 
TTTCTGAACG GGGATGCCGT CTTCATGCGC AACTGGCCCT ACGTGTTCGG GCTCTTCGGG 
CAGTTCCCGG TGAAGCCGGA GCAGGTGGAC GTGGCCCCGC TGCCGGTGGA CCGGGAGGGG 
CGGCAGTCCA CGAGCAGCCT CGGCGGCTGG AACCTGTTCA TCAACGCCGC CTCGGAGGAC 
GAGGCGGACG CCGCCTGGAC CCTCATAGAG TACCTCGCCG CCCCCGAGCA GCAGAAGCAG 
CGGGCGCTGG AGGGAGGGTA CCTTCCCACG CTGGAGGAGC TCTACGAGGA CCAGGAGATC 
CTGGACAAGG TGCCGGTCAT AGCGCTCGGC AAGGAGGCCA TCAGGAACAC CCGCCCGCGC 
CCGGTCTCGC CGTACTACTC GGACATGTCG CTCAGGATGG CCGAGCAGTT CAACGCCTCC 
CTCAAGGGCG AGGTCTCCCC CGAGGAGGCC GTCGGCACCC TGCGGGAGGA GCTGCAGAAC 
ATCGTGGAGC AGGGCAGCTA G

Protein sequence

MRRREEGGSL VRGRALFSRR EFLRLGGAGV AGAALLGVAG CGGGGEQGGP VQLVFSHGPE 
QSGVLREQLD AFNRRHEGEI RVEWREMPAQ TEQYFDRLRT QFQAGGGDID TISGDVIWPA 
QFAANGWIVD LSDRFPESER EKFLDGPINS NVYEGAIYGV PWFTDAGMLY YRKDLLQKSG 
YSEPPRTWDE LKEMALRVKQ DSGTKFGFVF QGANYEGGVV NGLEYIWTHG GDVLDPEDPT 
KVIIDSPESV AGLKTERSMV EEGVAPEAVV NYAEMESHTA FLNGDAVFMR NWPYVFGLFG 
QFPVKPEQVD VAPLPVDREG RQSTSSLGGW NLFINAASED EADAAWTLIE YLAAPEQQKQ 
RALEGGYLPT LEELYEDQEI LDKVPVIALG KEAIRNTRPR PVSPYYSDMS LRMAEQFNAS 
LKGEVSPEEA VGTLREELQN IVEQGS