Gene TM1040_3607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3607
Symbol
ID	4075034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	657267
End bp	658217
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	62%
IMG OID	638005126
Product	asparaginase
Protein accession	YP_611836
Protein GI	99078578
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.143302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTT GCGTAATCCA CACCGGCGGC ACCATTGGCA TGGCCCCCTC GCCAGAGGGG 
TTTGCCCCCA AAACAGGAAT CGTGGAGGCG GAGCTGGACC GTTTGCAGCG CATCGGCGCA 
ATAGAGGCTG ATTTCAGGGT TGTGACGGCA TCCCCTTTGA TCGACAGCGC CAACGCTACC 
TCGGCGGATT GGAACTGGAT CATGGCGCAG ATCGCAGCGC ATGATGATGA TTGCGCGGGG 
TTTGTGGTGA CACATGGCAC CGACACACTC GCCTTTACAG CCGCTGCTTT GTCCTTTGGT 
CTCAAAGGGT TGCGCAAGCC GGTTGTGATC ACCGGAGCGA TGCTGCCACT TTCCGAGGAG 
GGCAGCGACG GCAGCGACAA CCTCCGAGAC GCGTTTCGCG CGGTCGAACA GGCTGCGCCC 
GGCGTCTGGG TCCAATTTGC AGGGAAGTTG CTGCATGGCG CGCGGGTGCG AAAATCGCAT 
TCGGTGGCCT TTGACGCATT CAACGCATCA CCAACGGATG CCGCCCCCCT CCGGGCGGCC 
GAAACTCTCG GCATTTTTGA ATACGGCGAT GCCACCGCGC TGATTGCGGC GGTGGCTCCG 
GGAATGAATG CCTCCTTGAT TTCTTATGCG GTAGAACAGG CCGCGGGGAT TGTACTGCGC 
TGTTACGGCT CTGGCACCGT GCCCGAGGGC CTGGGGCTGC GCAAAGCCAT GTTGCAAGCA 
CGAGACACCG GCGTTCCGGT CCTCGCCGTG AGCCAATGTG CCGAGGGCGG CATTTCCCTT 
GGTACTTATG CGGCGGGTGC AATGCTTGCG CAGACCGGAG CTATCGACGG GCGCGACATG 
ACCGTCGAGG CGGCCTATGC CAAGCTGCTG CATGCGCTGT CGCAAAGCGC AGATCTGGCG 
ACTCGGCGCG AGATCCTTGA AACCCGCCTA TGTGGAGAAT GGGCCTTGTA G

Protein sequence

MTICVIHTGG TIGMAPSPEG FAPKTGIVEA ELDRLQRIGA IEADFRVVTA SPLIDSANAT 
SADWNWIMAQ IAAHDDDCAG FVVTHGTDTL AFTAAALSFG LKGLRKPVVI TGAMLPLSEE 
GSDGSDNLRD AFRAVEQAAP GVWVQFAGKL LHGARVRKSH SVAFDAFNAS PTDAAPLRAA 
ETLGIFEYGD ATALIAAVAP GMNASLISYA VEQAAGIVLR CYGSGTVPEG LGLRKAMLQA 
RDTGVPVLAV SQCAEGGISL GTYAAGAMLA QTGAIDGRDM TVEAAYAKLL HALSQSADLA 
TRREILETRL CGEWAL