Gene Saro_2814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2814
Symbol
ID	3916974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3037746
End bp	3038771
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	64%
IMG OID	640445593
Product	amidohydrolase 2
Protein accession	YP_498084
Protein GI	87200827
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.162302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATGA TCATCGACTG CCACGGTCAC TACACCGTGC TGCCGAAGGC GCACGACGAG 
TGGCGCGAGA AGCAGAAGGC CGCATTCAAG GCCGGGACCG AGTGCCCGCC CTATCCCGAG 
ATCTCAGACG ACGAGATCCG CGAGACGATC GAGAGCAACC AGTTGCGCCT GCTCAAGGAG 
CGCGGCGCGG ACATGACGAT CTTTTCCCCC CGCGCGAGCG CGATGGCGCC GCATGTGGGC 
GACCAGTCGG TCGCGGTGAA GTGGGCGCAG GTCTGCAACG ACCTGATCGC GCGCGTGGTC 
CGGCTCTACC CCGAGACCTT CGCGGGCGTG TGCATGCTGC CGCAGTCGCC GGAAGCGGAC 
ATGACCAGCT CCATCGCGGA GCTGGAGCGC TGCGTGAACG AACTGGGCTT CATCGGCTGC 
AACCTCAATC CCGATCCGGG CGGCGGGCAC TTCAAGCATC CTCCCCTGAC GGACGAATAC 
TGGTTCCCGT TCTACGAGAA GATGGTCGAG CTGGACGTTC CGGCGATGAT CCACGTCTCG 
GGTTCGTGCA ACCCGGCGAT GCACGCGACA GGCGGCTACT ACATCGCGGC CGACACCATC 
GCGTTCATGC AGCTTCTGGA GGGCGACCTG TTCAGCAGGT TCCCGACCCT GCGCTTCATC 
ATCCCGCATG GCGGCGGCGC GGTGCCCTAT CACTGGGGAC GCTATCGCGG GCTGGCCGAC 
ATGCTGAAGA AGCCCGGCCT CGACACGCAC CTGATGAACA ACGTGTTCTT CGACACCTGC 
GTCTATCACC AGCCCGGGAT CAACCTGCTG GCCGACGTGA TCGAGAACAA GAACATCCTG 
TTCGGATCGG AAATGGTCGG CGCGGTGCGC GGGATCGATC CGACGACCGG GTTCTATTTC 
GACGACACCA AGCGCTATGT CGACGCGCTC GACATCAGCG ATGCTGAACG CCACGCGATC 
TTCGAGGGCA ACGCGCGCCG CGTGTTCCCG CGCCTCGACG CCAAGCTGAA GGAGAGGGGC 
CTGTGA

Protein sequence

MTMIIDCHGH YTVLPKAHDE WREKQKAAFK AGTECPPYPE ISDDEIRETI ESNQLRLLKE 
RGADMTIFSP RASAMAPHVG DQSVAVKWAQ VCNDLIARVV RLYPETFAGV CMLPQSPEAD 
MTSSIAELER CVNELGFIGC NLNPDPGGGH FKHPPLTDEY WFPFYEKMVE LDVPAMIHVS 
GSCNPAMHAT GGYYIAADTI AFMQLLEGDL FSRFPTLRFI IPHGGGAVPY HWGRYRGLAD 
MLKKPGLDTH LMNNVFFDTC VYHQPGINLL ADVIENKNIL FGSEMVGAVR GIDPTTGFYF 
DDTKRYVDAL DISDAERHAI FEGNARRVFP RLDAKLKERG L