Gene Nham_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_2041
Symbol
ID	4029304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	2263851
End bp	2264888
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	637970498
Product	allophanate hydrolase subunit 2
Protein accession	YP_577299
Protein GI	92117570
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGC TTGTCGCCGC TGCTGCCGGG CCCGCGACGT CGGTTCAGGA CGGCGGGCGC 
TACGGCGTGC AGCGCTATGG CCTGACGCCG AGCGGCGCGG TGGATCGTCT CGCGCTGGCT 
GCCGCCAATT GCCTGGTCGG CAATCCGCCC TTTGCCGCTG CGATCGAAGT CGGGCCGTTC 
GGCGCGGCTT TCGTCGCCCG CGAGGGCAAG GTGCGCGTCG CGCTCGCGGG CGCCGTGCGG 
AACGCTGAAG TCGCGGGGCA CCCGGTGTCG TTCAACGAAT CCCGCACGCT CGGTGACGGC 
GAAAGCCTGA CGCTCGGCTT CGCACGCGAC GGGACCTTCA GCTATCTCGC CATTGAGGGT 
GGCGTGAGAG GCGAGCCGAC GTTCGGCAGC CTCGCCGTCA ACGCGCGTGC CGGCCTTGGC 
AGTCCGTTTC CGCGGCCATT GCAGGCCGGC GACGTCCTTG ATGTCGATGC TGCAAAGGCT 
ACGATCGAGC GGCGGATCGA CCTGCCCGCC GTATCCGATG GTCCGATCCG CGTCGTGATG 
GGTCCGCAGG ACGACGAATT CGGCGAGGCG ACGGATCTGT TCCTCCGCAG CGAGTGGAAG 
ATATCGGCGA CAAGCGACCG CATGGGCTAT CGCCTTGAAG GACCCGTTAT CAAGCATCTG 
CATGACCACA ACATCGTCTC CGACGGCACC GTGAACGGCA GCATTCAGGT TCCCGGCAAC 
GGACAGCCGA TCGTGCTGAT GCCGGATCGC GGCACCAGCG GCGGCTATCC GAAAATCGCG 
ACCGTGATCA CCGCCGACCT CGGTCGCTTC GCACAAATCC CCGCCGGCCA CACCTTCCGC 
TTCCAGGCGG TCACCATGAC TGATGCCCAG GCCGCGGCGC GCGCGATGGC GGACCTGTTG 
CAAACCCTCC CCGATCGCGC CCGCGAGGTG CGCAATGTCG ACATCAGCGA CGCGCTGCAG 
AACGCCAATA TCGCCGGCTC TGCGGTGAAT GCATTCGACA GCGGAACGTG GCAAACTTGG 
ACACCTCCGG AGCCATAG

Protein sequence

MSKLVAAAAG PATSVQDGGR YGVQRYGLTP SGAVDRLALA AANCLVGNPP FAAAIEVGPF 
GAAFVAREGK VRVALAGAVR NAEVAGHPVS FNESRTLGDG ESLTLGFARD GTFSYLAIEG 
GVRGEPTFGS LAVNARAGLG SPFPRPLQAG DVLDVDAAKA TIERRIDLPA VSDGPIRVVM 
GPQDDEFGEA TDLFLRSEWK ISATSDRMGY RLEGPVIKHL HDHNIVSDGT VNGSIQVPGN 
GQPIVLMPDR GTSGGYPKIA TVITADLGRF AQIPAGHTFR FQAVTMTDAQ AAARAMADLL 
QTLPDRAREV RNVDISDALQ NANIAGSAVN AFDSGTWQTW TPPEP