Gene Meso_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_2043
Symbol
ID	4181436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	+
Start bp	2195054
End bp	2196304
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	64%
IMG OID	638067939
Product	allantoate amidohydrolase
Protein accession	YP_674601
Protein GI	110634393
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.801178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAC CCGGCGAAAA TCTGAGGATC AATGCGGACC GCCTCTGGGA TTCCATTCAC 
GAGATGGCCG CGATCGGCCC CGGCATCGCC GGCGGCAACA ACCGGCAGAC GCTGACCGAC 
GAAGACGGCC AGGCACGGCA CCTCTTCAAG AAGTGGTGCG AGGAAGCCGG CATGTCCGTC 
TCCGTGGACG CCATGGGCAC TATGTTCGCG CAGCGCGAGG GCACCGACCC CGATGCCCTG 
CCCGTCTATG TGGGCTCCCA TCTCGATACG CAGCCGACGG GCGGCCGCTA TGACGGCGTG 
CTGGGCGTCC TCGGCGGGTT GGAGGTGATC CGCAGCCTCA ATGACCTCGG CATCAAGACG 
AAGCACCCGA TCGTCGTCAC CAACTGGACC AACGAGGAAG GCACCCGCTT CGCCCCGGCC 
ATGCTCGCCT CCGGCGTCTT TGCCGGCATG CATGATCTCG AATGGGCCTA TGACCGGAGG 
GATGCGCAGG GAAAGCGCTT CGGCGACGAG CTGGAGCGCA TCGGCTGGAA GGGCGAAGAG 
CCGGTCGGCG GCCGCAAGAT GAAGGCCTTC TTCGAGCTCC ACATCGAGCA AGGCCCGATT 
CTGGAGGACG AGGGGATTGA TATAGGCGTC GTCACCCACG GCCAGGGGCT CAAATGGCTC 
CAGGTGACGC TCTCCGGCCG CGAGAGCCAT ACCGGCTCGA CGCCCATGCC CAAGCGGCGC 
AACGCCGGGC TCGGCATGGC CCGCGTGATC GAGCTCGTCC ATGAAGTGGC GATGGACTAC 
CAGCCCCACG CCGTGGGCGC CGTCGGCCAC ATGGAGGTCT ATCCCAATTC CCGCAACATC 
ATCCCGGGCC AAACGGTTTT CACCATAGAC ATTCGCTCGC CCGACAAAAA AGTGCTCGAC 
ATGATGGATG CGCGCATCCG ACAGGGCATT GCGACCATTT GCGATGCGAT GGATATTACC 
TCCGAAATCG AGCAGGTCGG GCATTTCGAT CCCGTCACCT TCGACAAGGG ATGCGTCGAG 
GCAATCCGCA AGGCCGCCGA ACGGCTCGGA TACACGCACC GCGATATCGT CTCCGGCGCC 
GGGCATGATG CCTGCTGGAT CAACCGCGTG GCCCCCACGG CCATGGTCAT GTGCCCCTGC 
GTCGACGGCC TCTCCCACAA CGAAGCCGAG ATGATCACCA AGGAATGGGC GCAGGCTGGC 
GCCGATGTGC TTTTCCATGC TGTGGTGGAG ACGGCGGAAA TCGTTGAATG A

Protein sequence

MAAPGENLRI NADRLWDSIH EMAAIGPGIA GGNNRQTLTD EDGQARHLFK KWCEEAGMSV 
SVDAMGTMFA QREGTDPDAL PVYVGSHLDT QPTGGRYDGV LGVLGGLEVI RSLNDLGIKT 
KHPIVVTNWT NEEGTRFAPA MLASGVFAGM HDLEWAYDRR DAQGKRFGDE LERIGWKGEE 
PVGGRKMKAF FELHIEQGPI LEDEGIDIGV VTHGQGLKWL QVTLSGRESH TGSTPMPKRR 
NAGLGMARVI ELVHEVAMDY QPHAVGAVGH MEVYPNSRNI IPGQTVFTID IRSPDKKVLD 
MMDARIRQGI ATICDAMDIT SEIEQVGHFD PVTFDKGCVE AIRKAAERLG YTHRDIVSGA 
GHDACWINRV APTAMVMCPC VDGLSHNEAE MITKEWAQAG ADVLFHAVVE TAEIVE