Gene TM1040_0385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0385
Symbol	ureC
ID	4078618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	393082
End bp	394794
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	62%
IMG OID	638005680
Product	urease subunit alpha
Protein accession	YP_612380
Protein GI	99080226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0804] Urea amidohydrolase (urease) alpha subunit
TIGRFAM ID	[TIGR01792] urease, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCA ACATCCCTCG CTCTGACTAT GCCGCCATGT ATGGGCCGAC CACCGGCGAC 
CGCGTGCGGC TGGCCGATAC TGACCTGATC ATCGAGGTGG AGCGCGACCT CACCGGCCCT 
TACGGCGAAG AGGTCAAATT TGGCGGCGGC AAGGTGATCC GCGACGGGAT GGGACAGGCG 
CAGACGACGC GCGCGGGCGG CGCGGTCGAT ACCGTGATTA CCAACGCGCT GATCCTTGAT 
TGGACCGGCA TCTACAAGGC TGACGTCGGG CTGAAAGACG GGCGCATCCA TGCCATCGGT 
AAGGCCGGCA ACCCCGACAC TCAACCCAAT GTGACCATTA TCGTTGGCCC CGGCACCGAG 
GTGATCGCGG GCGAAGGGCG CATCCTGACG GCAGGCGGGT TTGACAGCCA TATCCATTAT 
ATCTGCCCGC AACAGATCGA GGATGCGCTG CACTCGGGTC TGACCACCAT GCTCGGCGGC 
GGCACCGGGC CAGCCCATGG GACTTTGGCC ACCACCTGCA CCCCCGGTGC CTGGCACCTG 
GGTCGGATGA TGCAGGCCGC AGATGCGTTT CCGATGAACC TGGCGTTTGC AGGCAAAGGG 
AATGCCTCGC TGCCCGCCGC CATTGAAGAA CAGGTTAACG CAGGCGCCTG CGCGCTGAAA 
CTGCATGAGG ACTGGGGCAC CACACCCGCT GCCATCGACT GCTGCCTCGG GGTGGCCGAT 
GCAATGGATG TGCAGGTGAT GATCCATACA GACACGCTCA ATGAGTCGGG GTTTGTGGAA 
CACACCGTCA AGGCCATGAA AGGCCGCACC ATCCACGCCT TTCACACCGA AGGTGCGGGC 
GGTGGCCACG CACCGGACAT CATCAAGATC TGCGGTGAGG AGTTCGTGTT GCCCTCCTCG 
ACCAACCCGA CCCGCCCCTT CACCGTGAAC ACCATCGAAG AGCACCTCGA CATGCTCATG 
GTCTGTCATC ACCTCGACAA ATCCATCCCC GAGGATGTGG CCTTTGCCGA GAGCCGGATC 
CGGCGCGAAA CCATTGCCGC CGAGGACATC CTGCACGACA TGGGGGCCTT CTCGATCATC 
GCAAGCGACA GCCAGGCGAT GGGACGCGTG GGCGAGGTCA TCATTCGCAC ATGGCAGACC 
GCAGACAAGA TGAAGAAACA GCGCGGCCGC CTGAGCGAGG AAACAGGTGA GAACGACAAC 
TTTCGCGTGC GGCGCTATGT GGCAAAATAC ACCATCAACC CGGCGATCGC GCATGGGATC 
GCGCATGAAA TTGGCTCTAT CGAGGTGGGC AAGCGCGCGG ATCTGGTGCT GTGGAACCCA 
GCCTTCTTTG GTGTAAAGCC CGAGATGGTC CTGATGGGCG GCACCATCGC CTGCGCGCAA 
ATGGGCGATC CCAACGCCTC CATTCCGACG CCGCAGCCGG TCTATTCGCG TCCCATGTGG 
GGCGCTTACG GGCGCTCGGT CGAGCATTCT GCCGTCACCT TTGTGTCCGA GGCCGCGCAG 
GCCGCAGGCA TCGGTAAGAC ACTGGGTCTT GCAAAACAGA CACTTGCGGT AAAGGGCACA 
CGCGGGATCG GGAAGTCAGC ACTCAAGCTC AACACCGCCA CGCCTGAGAT CGAGGTTCAC 
CCTGAAACCT ATGAGGTACG CGCGAATGGG GAGCTTTTGA CCTGTCAGCC CGCCGAGGAA 
CTGCCCTTGG CACAGCGATA TTTCCTCTTC TAA

Protein sequence

MPANIPRSDY AAMYGPTTGD RVRLADTDLI IEVERDLTGP YGEEVKFGGG KVIRDGMGQA 
QTTRAGGAVD TVITNALILD WTGIYKADVG LKDGRIHAIG KAGNPDTQPN VTIIVGPGTE 
VIAGEGRILT AGGFDSHIHY ICPQQIEDAL HSGLTTMLGG GTGPAHGTLA TTCTPGAWHL 
GRMMQAADAF PMNLAFAGKG NASLPAAIEE QVNAGACALK LHEDWGTTPA AIDCCLGVAD 
AMDVQVMIHT DTLNESGFVE HTVKAMKGRT IHAFHTEGAG GGHAPDIIKI CGEEFVLPSS 
TNPTRPFTVN TIEEHLDMLM VCHHLDKSIP EDVAFAESRI RRETIAAEDI LHDMGAFSII 
ASDSQAMGRV GEVIIRTWQT ADKMKKQRGR LSEETGENDN FRVRRYVAKY TINPAIAHGI 
AHEIGSIEVG KRADLVLWNP AFFGVKPEMV LMGGTIACAQ MGDPNASIPT PQPVYSRPMW 
GAYGRSVEHS AVTFVSEAAQ AAGIGKTLGL AKQTLAVKGT RGIGKSALKL NTATPEIEVH 
PETYEVRANG ELLTCQPAEE LPLAQRYFLF