Gene CPS_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4042
Symbol
ID	3522885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	4251552
End bp	4252787
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	50%
IMG OID	637286487
Product	allantoate amidohydrolase
Protein accession	YP_270699
Protein GI	71282411
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00143061
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAATA ATAAAATCAA TGGTCAGCGT TTGTGGGATA GCTTGATGGA GATGGGGCAA 
ATTGGTGGCA CACCCAAAGG TGGTGTTTGC CGGTTAGCTC TGACAGATCT CGATAAAGAG 
GGGCGCGACC TCTTCGTTGA CTGGTGTCTG GAGGCTGGTT GTACTGTTCG TGTTGACACT 
ATGGGTAACA TATTCGCCCG ACGGGCTGGT AAAGATAATA GTCTGCCACC TGTGGTGATG 
GGCAGCCACC TAGATACTCA GCCGACGGGC GGTAAGTTTG ACGGTATTTA TGGTGTATTA 
TCGGGACTGG AAGTGATCCG CAGTTTAAAC GATCACAATA TAGAGACCCT TGCTCCTGTT 
GAAGCTTCTG TTTGGACAAA TGAAGAAGGA TCACGTTTCC CACCAGCGAT GGTGGCCTCT 
GGGGTATTTG CCGGGGTTTT TGATCTTGAG TACGGTCTCA GTCGTGCCGA TCTCGATGGT 
AAAACTATGG GGGACGAGCT TGCCCGCATT GGTTATGCCG GTGAAGTGGA GTGCGGTAAT 
CGTGAATTCA AGGCGTTCTT CGAAGCGCAT ATCGAGCAGG GACCGATCCT CGAAAATGAA 
AAGAAAACCA TTGGCATTGT GACTGATGCT CAGGGACAGC GATGGTATGA AGTGACACTT 
ACAGGGCAGG AATCCCATGC CGGACCAACG CCGATGCTGA GTCGGAAAGA TGCACTGGTA 
GGCGCTGCTA AGATTATTGA TCAGGTTAAC CGTATTGGTC TGAGTAACCA GCCTAGCGCT 
TGTGCGACTG TTGGTCTGTT GCAGGTATTC CCTAATTCGC GCAACGTCAT TCCGGGAGAA 
GTGTTTTTTA CAATTGATTT CCGTCATCCC AATGATCAGA TTCTGGCAGC AATGGACCAT 
GAACTACGTG AGTTAAGCCA ACGAATTGCC GATGAGCAGG GCCTAGAAAT GAAGTTCGAG 
CAGATCTGGC ACTCACCACC GGTACCTTTT AACAAAAACT GTGTCGATTC GGTACGGAAA 
GCTGCTGAAA CGTCAGGTTA CAGCCACCAG GATATTATCA GTGGCGCTGG TCACGATGCC 
TGTTATATCT CGCGGGTGGC ACCCACCGCT ATGGTATTTG TCCCTTGTGA AAATGGTATC 
AGCCATAATG AAGCCGAAAA CGCTGATCCT GCCGATTTAG CGGCTGGCTG TGATGTGTTA 
TTCCAAGCAG TCGTTGAACA GGCTAACGAC GCCTAA

Protein sequence

MLNNKINGQR LWDSLMEMGQ IGGTPKGGVC RLALTDLDKE GRDLFVDWCL EAGCTVRVDT 
MGNIFARRAG KDNSLPPVVM GSHLDTQPTG GKFDGIYGVL SGLEVIRSLN DHNIETLAPV 
EASVWTNEEG SRFPPAMVAS GVFAGVFDLE YGLSRADLDG KTMGDELARI GYAGEVECGN 
REFKAFFEAH IEQGPILENE KKTIGIVTDA QGQRWYEVTL TGQESHAGPT PMLSRKDALV 
GAAKIIDQVN RIGLSNQPSA CATVGLLQVF PNSRNVIPGE VFFTIDFRHP NDQILAAMDH 
ELRELSQRIA DEQGLEMKFE QIWHSPPVPF NKNCVDSVRK AAETSGYSHQ DIISGAGHDA 
CYISRVAPTA MVFVPCENGI SHNEAENADP ADLAAGCDVL FQAVVEQAND A