Gene Bind_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1041
Symbol	ureC
ID	6199952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	1193551
End bp	1195263
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	58%
IMG OID	641705033
Product	urease subunit alpha
Protein accession	YP_001832173
Protein GI	182678027
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0804] Urea amidohydrolase (urease) alpha subunit
TIGRFAM ID	[TIGR01792] urease, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.497339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCA CCCTACCCCG CCCCGCTTAT GCCGGCATGT TTGGACCGAC CACGGGCGAC 
AAGGTTCGCC TTGCCGATAC GGAGCTTTTC ATCGAGATCG AACGCGATTT CACCCTTTAT 
GGCGAGGAAG TGAAATTTGG CGGCGGCAAG GTCATTCGCG ACGGGATGGG ACAAGGCCAG 
GCCTCAAAAG CCGAGGGCGC GGCGGATACA ATTATCACCA ATGCCGTGAT CATCGACCAT 
TGGGGCATTG TCAAAGCCGA TGTCGGGCTG CGTGATGGGC GCATTATCGG CATTGGCAAG 
GCGGGCAATC CCGATGTCCA GCCGGGCATC GATCTCATCA TCGGCCCTGG CACCGAAATC 
ATTGCCGGTG AGGGACGCAT TCTCACCGCT GGCGGGTTCG ACAGCCATAT TCATTTCATC 
TGCCCTCAAC AAATTGAAGA GGCCTTGGCC TCGGGCATGA CGACAATGCT CGGCGGGGGC 
ACCGGCCCAG CGACAGGCAC TTTCGCGACG ACCTGCACGC CAGGACCCTG GCATATTGCC 
CGGATGATCG AAGCCTCTGA CGGTTTCGCC ATGAACCTCG GTTTTGCCGG CAAGGGCAAT 
GCCTCCAGAT CTGAAGGTCT CGTCGAGCAG ATCGAGGCGG GCGCTTGCGC CCTGAAACTG 
CATGAGGATT GGGGCACGAC ACCAGCGGCC ATCGACTGCT GCCTGTCCGT CGCTGATGAT 
CACGATATAC AGGTCATGAT CCACACGGAT ACATTGAACG AATCCGGTTT CGTCGAGGAC 
ACGATCCGCG CCTTCAAGGG GCGCACCATT CATGCCTTCC ACACCGAAGG CGCCGGAGGC 
GGCCATGCGC CCGACATTAT GAAAGTCGCG GGCCTGCCCA ATGTCCTGCC TTCCTCGACC 
AATCCGACAC GGCCCTTCAC CGTCAATACG CTCGACGAAC ATCTCGACAT GCTGATGGTT 
TGCCATCATC TCGATCCCTC CATTGCGGAG GATCTCGCCT TCGCCGAAAG CCGTATCCGC 
AAGGAAACCA TTGCGGCTGA GGATATTCTG CACGACCTTG GTGCTTTATC GATGATGTCC 
TCGGATAGTC AGGCCATGGG ACGCATCGGC GAGGTGATCA CACGCACCTG GCAGACAGCC 
GATAAGATGA AGCGTCAGCG CGGACCACTC CCCGAAGACA AGAGCAATAA CGACAATTTC 
CGTGTGCGCC GTTACATTGC CAAATACACA ATCAATCCGG CCATCACTCA TGGCGTTTCG 
CGTCACATCG GCTCGATCGA GCCCGGCAAG CTCGCCGATC TTGTTTTATG GACGCCTGCT 
TTTTTCGGCG TGAAGCCGGA TCTCGTCATC AAGGGCGGTA TGATCGCCTA TGCGATGATG 
GGCGATCCCA ACGCCTCGAT CCCGACACCG CAACCCGTGC ATGGGCGCCC AATGTTCGGA 
AGTTTTGGCG GGGCACGGAC CGGCACGTCC TTAACTTTTA CGTCGAAGAC GGCCCTGGCG 
CATGGCCTGG CCCAAAAGCT CAAAATTTCG CGTAAATTAG TACCCGTCGA AAACACCCGC 
GGAAATTTGC GCAAGACGAG CCTGATCCTC AACGGCGCGA TGCCTCACAT CGAGATCGAT 
CCGGAAACCT ATGTGGTCAA GGCTGATGGC ATGGTACTGA CCTGCGAGCC AGCGAGGAGC 
CTGCCCATGG CGCAGCGCTA TTTTCTGTTC TGA

Protein sequence

MAVTLPRPAY AGMFGPTTGD KVRLADTELF IEIERDFTLY GEEVKFGGGK VIRDGMGQGQ 
ASKAEGAADT IITNAVIIDH WGIVKADVGL RDGRIIGIGK AGNPDVQPGI DLIIGPGTEI 
IAGEGRILTA GGFDSHIHFI CPQQIEEALA SGMTTMLGGG TGPATGTFAT TCTPGPWHIA 
RMIEASDGFA MNLGFAGKGN ASRSEGLVEQ IEAGACALKL HEDWGTTPAA IDCCLSVADD 
HDIQVMIHTD TLNESGFVED TIRAFKGRTI HAFHTEGAGG GHAPDIMKVA GLPNVLPSST 
NPTRPFTVNT LDEHLDMLMV CHHLDPSIAE DLAFAESRIR KETIAAEDIL HDLGALSMMS 
SDSQAMGRIG EVITRTWQTA DKMKRQRGPL PEDKSNNDNF RVRRYIAKYT INPAITHGVS 
RHIGSIEPGK LADLVLWTPA FFGVKPDLVI KGGMIAYAMM GDPNASIPTP QPVHGRPMFG 
SFGGARTGTS LTFTSKTALA HGLAQKLKIS RKLVPVENTR GNLRKTSLIL NGAMPHIEID 
PETYVVKADG MVLTCEPARS LPMAQRYFLF