Gene Rxyl_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3037
Symbol
ID	4115972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	3044409
End bp	3045908
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	52%
IMG OID	638037806
Product	amidohydrolase
Protein accession	YP_645758
Protein GI	108805821
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCCG AACGTATATT GCTGCGCTGC GATATATTGA TTGTCGACGC TTTATCAGAC 
CCGATCTACA ACGCCGCCAT CCTGATCGAA GACGGGCATG TGGAATCCGT CGGTGACTAT 
CACGCTATGC GACGAAGTTA CCCACTGGCA TCGGAACATG GGAAACGAAT CCCTCTTGCT 
ATGCCTGGCC TCGTCGATGG CCACTCCCAC GGGCGTGGGA TATCAACCGT CGAGCAAGGC 
ATAGCAGACG CGCCGCTTGA TATCTGGCTA ACGCGCATAA CCGCAGCTAC CGCGTTTGAC 
CCTTACGATG AGGCATTGGT CTCAGCAGCG GAACTCATCA CCACAGGAGT TACTACAGTC 
CAGGTTATTT TCCATTCTTT CTCTAAGGCA GAAGATTATG TGCAAGGAGT TATCGCAACA 
GCTAAAGGAT TTAAGCAAGT GGGGGTCGGC TTAGAGCTCG TTCTGGGCAT AAGCGACCAG 
CACGAGTTTA TACCACCCGT TAGCACATCA CTCCACAGCC GCGTAGATCG TTTGCTCTCA 
TCTCCTGAGC GAGGAATGGA TCCAACAACC TTTTTCGAAA TGTTCGACGC TCTCTCCGGT 
TTGAAGAGCG ACACTTCGAT ACTCCCTACA AAAGAGGTTC AAGAAATTTT AAGCGAAACG 
CGACTAGTGC TTGGTCCAAT CGCGCCGCAA TGGTCATCTG AAAACCTCAT ACAAGGCATC 
GCTGACCGAG CAGCCCAGGG TGTACGTGTA CACACGCACC TATTGGAGTG TAAAAAACAG 
CGTTCGCCTT TGTACGGCCC ACTGCCAGTA CAGAAGCTGG ATCAGCACGA ACTGTTAAGT 
AACAGAACCT CTGTCGCACA CGGTGTGTGG CTTGAGCCAG ATGAGATAGC CCTACTAGCA 
GCACGAAAAG TGTCCGTAGT CCATTGTGCA GGCTCTAACA CCCGACTTGA AGTTGGTTTA 
GCACCAGTAC GCGAGATGCT CGACGCTGGC GTGCTTGTAG CCATCGGTCT TGACAGCAAC 
ACTGTACACA ATCCTCCAGA TATCTTTGCG GAGATGCGCC ACGCGCTTGA GGTAGCGAGC 
GCTCGAGGAT CGCAGGTTTC GGAGAGAGAA GTCCTCGCCA TGGCGACCTC TGGCGGCGCA 
GCCGCTATAG GACGACAGGA TGAAGTTGGC ACTCTCAGAC CAGGCTCAAG AGCAGACTTG 
GTTATTCTTA CACCAACTGA ACCCTTGACT GTCTACGAAG ATCCAATCTC GTGGATTGTC 
GGCGAAGCTT CAAGAAACGA CCTGCACGAA GTGTGGGTAG AAGGAAAAGT ACTATACAGC 
AACGGTTGTC TGCGCAACTC GTCTATAGTA GCAACAGCTC GGCGGCATCT ATATGAAGCC 
CTGCTTCAGG ATGCGGTACG CCGTAGGGAG CGACTTAAGG AGCTGAGAAA GCTGGAACCA 
TGGCTGAGAG GAATCTGGGA GAAGACAAGC ACCGCAACAA CCCAGGAGAA CCGTTCGTAG

Protein sequence

MNPERILLRC DILIVDALSD PIYNAAILIE DGHVESVGDY HAMRRSYPLA SEHGKRIPLA 
MPGLVDGHSH GRGISTVEQG IADAPLDIWL TRITAATAFD PYDEALVSAA ELITTGVTTV 
QVIFHSFSKA EDYVQGVIAT AKGFKQVGVG LELVLGISDQ HEFIPPVSTS LHSRVDRLLS 
SPERGMDPTT FFEMFDALSG LKSDTSILPT KEVQEILSET RLVLGPIAPQ WSSENLIQGI 
ADRAAQGVRV HTHLLECKKQ RSPLYGPLPV QKLDQHELLS NRTSVAHGVW LEPDEIALLA 
ARKVSVVHCA GSNTRLEVGL APVREMLDAG VLVAIGLDSN TVHNPPDIFA EMRHALEVAS 
ARGSQVSERE VLAMATSGGA AAIGRQDEVG TLRPGSRADL VILTPTEPLT VYEDPISWIV 
GEASRNDLHE VWVEGKVLYS NGCLRNSSIV ATARRHLYEA LLQDAVRRRE RLKELRKLEP 
WLRGIWEKTS TATTQENRS