Gene Rxyl_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2603
Symbol
ID	4114684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	2628556
End bp	2629572
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	69%
IMG OID	638037376
Product	twin-arginine translocation pathway signal
Protein accession	YP_645332
Protein GI	108805395
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.912871
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAG GCCTCTTCTG GCGGGGACGC AGGATCTCGC GCCGCGAGTT TCTCGGCGTC 
GCGGCCGCGG GCACCGGGGC GGTGTTCCTC GGGGGCCTCA CCACCTCCTG CGGCGGGGGC 
GGAGGAGAAG GCGAGGGCTA CAGGCTCGCT CTCATAGTCG GGGTCACCGG CGACGAGTTC 
TACACCACCA TGGAGTGCGG GGCGCGGGCG GCGGCCCGAA AGCTCGGCGC CAGGCTCAAC 
GTGCAGGGGC CCGAGGAGTT CTCGCCCGCG GCGCAGACCC CCATCCTGAA CGCCGTGGTG 
CAGTCCAACC CCGACGCCAT CCTCATCGCC CCCACAGACC GGACCGCGAT GGTGGGTCCC 
ATCCAGAGCG CCGTCAACCA GGACATCCCC GTGGTGCTGG TGGACACCAC CATCGAGAAG 
GAGGAGATAG CGCTGGCCCG CATCTCCTCG GACAACGTCG AGGGGGGCAG GATGGCCGGG 
GAGGCCCTGG CCGAGCAGAT AGGGGGCAAG GGCAAGGTGC TCCTCATCAG CGTCAAGCCG 
GGCATCTCCA CCACCGACCA GCGCAAGCAG GGCTTCGAGG AGGCGATAAA GCAGTACCCG 
GACATCGAGT ACCTGGGGAC CGAGTACTGC AACGACGACC CCACCCAGGC GGCCTCCATC 
ACCACCTCCA CCCTGCAGGC CCACCCGGAT TTGGCCGGCA TCTTCGGCGC CAACGTCTTC 
TCCGGACAGG GAGCCGGGAC CGGGGTCCGG CAGGCGGGCA AGCGGGACCA GGTGAGCGTG 
GTGGCCTTCG ACGCCTCCCC CACCCAGGTG GAGGATCTGC GCCGGGGCAA CCTGGACGTG 
CTCATCGCCC AGCACCCCAA CGACATCGGG AGAAGGGGCG TCCAGATCGC CGTGAGGTAC 
CTGGAGAGCG GCGAGGAGCC GGAGAACAAG CAGATCACCA CCGGCTTCAC CACCGTCACC 
CGCGACAACC TGGACGCCCC CGAGGTCGAG CGTTACCTCT ACCGGGCCCA GTGCTAG

Protein sequence

MNEGLFWRGR RISRREFLGV AAAGTGAVFL GGLTTSCGGG GGEGEGYRLA LIVGVTGDEF 
YTTMECGARA AARKLGARLN VQGPEEFSPA AQTPILNAVV QSNPDAILIA PTDRTAMVGP 
IQSAVNQDIP VVLVDTTIEK EEIALARISS DNVEGGRMAG EALAEQIGGK GKVLLISVKP 
GISTTDQRKQ GFEEAIKQYP DIEYLGTEYC NDDPTQAASI TTSTLQAHPD LAGIFGANVF 
SGQGAGTGVR QAGKRDQVSV VAFDASPTQV EDLRRGNLDV LIAQHPNDIG RRGVQIAVRY 
LESGEEPENK QITTGFTTVT RDNLDAPEVE RYLYRAQC