Gene Namu_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0236
Symbol
ID	8445816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	265887
End bp	266969
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	71%
IMG OID	645039381
Product	allantoicase
Protein accession	YP_003199656
Protein GI	258650500
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG4266] Allantoicase
TIGRFAM ID	[TIGR02961] allantoicase

Plasmid Coverage information

Num covering plasmid clones	63
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGGA CCGATCTGAA CCTGGCCAGC CGGGCCCTGG GCGCATCGGT GCGCTACGTC 
AGCGACGAGT TCTTCGCCCC GTGCGAGGCG TTGCTGATGC CGGGCGCACC CGTGCACGAC 
GTGAGCACCT TCGGCCCGCA CGGGAAGATC TACGACGGGT GGGAGACCCG GCGCCGGCGC 
ACCCCCGGTC ACGACTGGGC CGTCGTGGCC CTCGGCGTTC CCGGCGTGCT GCACGAGATC 
GTCGTCGACA CGGCGTTTTT CCGCGGCAAC TACCCGCCCG AGGTGTCGAT GGAGGCGACC 
TGGCTGGACG GTGCGCCCGA CCGGGCCGCG CTGGATGCCG CGGAATGGAC GACGATCGTG 
CCGATCTCCG CGGCCCGCGG CGACACCGCC AACACCTACC GCGTCTACAA CAGCCAGGCC 
TTCACCCATG TCCGGCTCAA CATCTATCCC GACGGTGGGG TGGCCCGGCT GCGGGTCCTG 
GGCACCGCGG TGCCCGACCC GCGGGTGCTG GGCGATCGGA TCGATCTGGC CGCGATTCAC 
CACGGCGGGG ACATCGCCGA ATGCTCGGAC ATGTTCTATT CCGACGCCCG CCACGTGCTC 
TATCCCGGCA TCGCCGAGTC GATGGCCGAC GGCTGGGAGA CCGCGCGGCG GCGGACCGCC 
GGCAACGACT ACCTGGTGGT CACCCTGGCC GGCCCGGCCG AGCTGGAGTT CGTCACCATC 
GACACCGGCT ACTTCCTGGG CAATGCCCCT GGGCGGGTGC GTCTTTCGGC CCGGCGAACC 
GACACCTCGG CCTGGCGGGA GATCGTGCCC GAGCGTGCGA TCTCGCCGGA TGCGCGCAAC 
CGGTTCCGGG TGCTGGCCGA CCGGCAGGTC ACCGCGGTCC GGGTGGACGT CTACCCCGAC 
GGCGGGTTCT CCCGGCTGCA CCTGATGGGC AAGCTGCTGC CCGAGGCGCT GTCCCGGGCG 
ATCGCCCACT GGCTAGAGCG GCTGCCGAAA TCGGCCTCGG CCACGGTGCT GGCCGAGGCC 
GGCCTGGGCG GCATCCCGCT CGGTGAACTG CGCGAGGACC AGCTGCTGAC ACTGGCCTGG 
TGA

Protein sequence

MKRTDLNLAS RALGASVRYV SDEFFAPCEA LLMPGAPVHD VSTFGPHGKI YDGWETRRRR 
TPGHDWAVVA LGVPGVLHEI VVDTAFFRGN YPPEVSMEAT WLDGAPDRAA LDAAEWTTIV 
PISAARGDTA NTYRVYNSQA FTHVRLNIYP DGGVARLRVL GTAVPDPRVL GDRIDLAAIH 
HGGDIAECSD MFYSDARHVL YPGIAESMAD GWETARRRTA GNDYLVVTLA GPAELEFVTI 
DTGYFLGNAP GRVRLSARRT DTSAWREIVP ERAISPDARN RFRVLADRQV TAVRVDVYPD 
GGFSRLHLMG KLLPEALSRA IAHWLERLPK SASATVLAEA GLGGIPLGEL REDQLLTLAW