Gene TM1040_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2056
Symbol
ID	4077983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2159766
End bp	2160791
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	638007375
Product	allophanate hydrolase subunit 2
Protein accession	YP_614050
Protein GI	99081896
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTGC GCCTTATTGT TCACCGCGCA GGACCGGGTC TGAGCATTCA GGATCTTGGC 
CGTAGCGGCT ATCTCGCCTT TGGTCTGTCG CGCGGTGGCG CGGCGGATCG GCTGGCGCTT 
TATGAGGGCG CGGCGCTCTT GGGACAGGAA CCAAGCGCGG CGGCCATCGA GATGGCCGGG 
CTTGGCGGCA CATTTGAGGT CACAACCGAT ACCCGTATCG CCCTCACAGG TGCGCCGATG 
AAGGCCACGC TACAGGACGG CTCGGAATTG CGCTGGAATG CCAGCCACCT TCTTGCGGCC 
GGGATGCAGC TCAGCATTGG CGCAGTGCGG GCGGGGTCGT ATGGCTACCT TCATGTGGGC 
GGCGGCATCG CAAACGCGCT GCAGCTTGGC GCGCGCAGTG CGCATCTCGC CTCGGGGCTT 
GGCGCACGTC TCCGGGATGG GGCGGAGCTG CCCCTTGGTG ACGATGCAGG GGGTGCAGTC 
AATATGACCC TGACCCCCGA GCCGCGCCTG GACGGCGGCA CGCTGCGCAT GGTGCCAAGC 
CTGCAAACCA GCCTTTTTGG CGCGGCAGAG GTGGCCCGCT TTCAAGAGGT ACGCTTTCAC 
CGTGACAGCC GCGCCAATCG CATGGGGGTG CGGCTCTTGC CGGAGGGGCA GGGGTTTGCG 
CTTGAGGGGG GCTTGAGCGT TCTTTCCGAG GTGATCGCAC CCGGTGACAT TCAGGTCACC 
GGCGATGGCA CGCCCTATGT TTTGATGAGC GAATGCCAGA CCACCGGCGG CTATCCCCGC 
ATCGGCTCTG TTCTGCCTTG CGATATGCCG CGCGTGGCAC AGGCACAGGC AGGAGCGGCG 
TTTCGCTTTG AACAGGTGAC ACTTGAGGAA GCGGTCGAGA TTGAACGGCG GGCCCGCGCC 
GAGCGCGAGC GTCTGCCCTC CCGGCTGACG CCGCTTGTGC GTGATCCGGC CCGAATGCGG 
GATCTTCTGT CCTATCAACT GGTGAGCGGC GTGACCGCCG GGCGCGATCT TGATGAGGCG 
CTCTGA

Protein sequence

MSVRLIVHRA GPGLSIQDLG RSGYLAFGLS RGGAADRLAL YEGAALLGQE PSAAAIEMAG 
LGGTFEVTTD TRIALTGAPM KATLQDGSEL RWNASHLLAA GMQLSIGAVR AGSYGYLHVG 
GGIANALQLG ARSAHLASGL GARLRDGAEL PLGDDAGGAV NMTLTPEPRL DGGTLRMVPS 
LQTSLFGAAE VARFQEVRFH RDSRANRMGV RLLPEGQGFA LEGGLSVLSE VIAPGDIQVT 
GDGTPYVLMS ECQTTGGYPR IGSVLPCDMP RVAQAQAGAA FRFEQVTLEE AVEIERRARA 
ERERLPSRLT PLVRDPARMR DLLSYQLVSG VTAGRDLDEA L