Gene Anae109_4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_4049
Symbol	ureC
ID	5374233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	4737238
End bp	4738953
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	73%
IMG OID	640845576
Product	urease subunit alpha
Protein accession	YP_001381211
Protein GI	153006886
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0804] Urea amidohydrolase (urease) alpha subunit
TIGRFAM ID	[TIGR01792] urease, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGGC GGATGGATCG GCGGCAGTAC GCGCAGGTGT ACGGCCCGAC GACCGGCGAC 
CGGGTCCGGC TGGGCGACAC CGCGCTCGTG CTCGAGGTCG ACCGGGACCT CACCGTGTAC 
GGCGACGAGT GCGTCTTCGG CGGCGGCAAG GTCCTGCGCG ACGGGATGGG GCAGGCGGCC 
GGCGCGCCGC CGGAGGAGGT GCTCGACCTC GTCATCACCA ACGCGCTCGT GCTGGATCAG 
GGCGGCGTCA CCAAAGCGGA CGTGGGCATC CGCGGCGGCC GGATCGCGGC CCTCGGCAAG 
GCGGGCAACC CCGACGCGAT GGCGGGGGTG ACGCCGGGGA TGACGATCGG ACCCGGCACG 
GAGTGCATCG CCGGCGAGGG GCTCATCCTC ACCGCCGGCG GCGTGGACTC GCACATCCAC 
TTCATCTCGC CGCAGCAGGC CTACGAGGCG ATCGCGAGCG GCGTGACGAC CATGCTCGGC 
GGGGGCACCG GCCCGGCCAC CGGCACCAAC GCCACGACCT GCACGCCGGG CGCCCGGCAC 
GTCGCGCTCC TGCTGCAGGC GACCGACGCC CTGCCGGTGA ACATCGGGCT CCTCGGCAAG 
GGAAACGCCG CGTCGCCGGA GGGGCTGGCC GAGCAGGTCC GCGCCGGAGC GGTGGGCCTG 
AAGCTCCACG AGGACTGGGG CACGACGCCG GCGGCGATCG ACACCTGCCT GCGCGTCGCC 
GACCAGCTCG ACGTGCAGGT GGCCATCCAC ACCGACACGC TCAACGAGTC CGGCTGCGCC 
GAGCACTCCA TCGCCGCGTT CGCGGGGCGC ACCATCCACA CGTTCCACAC GGAGGGGGCG 
GGCGGCGGCC ACGCGCCGGA CATCATCCGC GTGTGCGGCG AGCCGAACGT CCTCCCCTCC 
TCGACCAACC CGACCCGTCC GTTCACGGTG AACACCGTCG ACGAGCACCT CGACATGCTC 
GTCGTCTGCC ACCACCTCGA CCCGTCCTTG CCCGAGGACC TCGCCTTCGC GGAGAGTCGC 
ATCCGCCGCG AGACCATCGC GGCCGAGGAC GTCCTGCACG ACCTCGGCGC GATCTCGATG 
ATGAGCTCGG ACTCGCAGGC GATGGGGCGC GTCGGGGAGG TCGTCACCCG CACCTGGCAG 
ACCGCCGACA AGATGCGCCG GCAGCGCGGG CGGCTCCCGG AGGAGCGGGG CGACAACGAC 
AACCTGCGCA TCCGCCGCTA CCTCGCGAAG TACACCATCA ACCCCGCCGT CGCCCACGGC 
CTCTCGCACG AGGTCGGGTC GGTCGAGCCC GGCAAGCTCG CCGACCTGGT GCTGTGGCGG 
CCGGCGTTGT TCGGGGCGAA GCCCGAGCTC GTGCTGAAGG GCGGGCTCAT CGCCTGGGCG 
CAGATGGGCG ACGCGAACGC CTCCATCCCG ACGCCGCAGC CGGTCGTGGC GCGCCCCATG 
TTCGGCGCGC TCGGCCGCGC GGTGGGTGCG ACGAGCGTCG CCTTCGTCTC GCGGGCCTCC 
CTCGAGGGCG GCGCGGTGCA GGGCTACGGG CTCGCGAAGC GGCTCGTCGC CGTGCACGGC 
TGCCGTGGGC TCGGCAAGAA GGACATGCGG CTCAACGACG CGCTGCCGCG GATGGAGGTG 
GACCCGGAGA CGTACGAGGT GCGGGCCGAC GGGGTGCTCC TGCGCTGCGA GCCGGCGGCC 
CGCCTCCCGC TCGCGCAGCG CTACTTCCTG TTCTGA

Protein sequence

MTRRMDRRQY AQVYGPTTGD RVRLGDTALV LEVDRDLTVY GDECVFGGGK VLRDGMGQAA 
GAPPEEVLDL VITNALVLDQ GGVTKADVGI RGGRIAALGK AGNPDAMAGV TPGMTIGPGT 
ECIAGEGLIL TAGGVDSHIH FISPQQAYEA IASGVTTMLG GGTGPATGTN ATTCTPGARH 
VALLLQATDA LPVNIGLLGK GNAASPEGLA EQVRAGAVGL KLHEDWGTTP AAIDTCLRVA 
DQLDVQVAIH TDTLNESGCA EHSIAAFAGR TIHTFHTEGA GGGHAPDIIR VCGEPNVLPS 
STNPTRPFTV NTVDEHLDML VVCHHLDPSL PEDLAFAESR IRRETIAAED VLHDLGAISM 
MSSDSQAMGR VGEVVTRTWQ TADKMRRQRG RLPEERGDND NLRIRRYLAK YTINPAVAHG 
LSHEVGSVEP GKLADLVLWR PALFGAKPEL VLKGGLIAWA QMGDANASIP TPQPVVARPM 
FGALGRAVGA TSVAFVSRAS LEGGAVQGYG LAKRLVAVHG CRGLGKKDMR LNDALPRMEV 
DPETYEVRAD GVLLRCEPAA RLPLAQRYFL F