Gene TM1040_3732 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3732
Symbol
ID	4075439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	790000
End bp	791391
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	60%
IMG OID	638005252
Product	argininosuccinate lyase
Protein accession	YP_611961
Protein GI	99078703
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.663919
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACA AGACCTCGAA CCAGATGTGG GGCGGCCGCT TTGCCGCCGG ACCGGACGCG 
ATCATGGAGG CAATTAATGC CTCTATCGGG TTCGACCAGC GCATGGCAGC GCAGGATATT 
GCTGGCTCTC GGGCTCATGC GGCGATGCTC GCCGCGACCG GTGTCATTAC GGATAATGAC 
GCCGAGGCGA TCCGTGAAGG GCTGCTCACC GTTTTGTCAG AGATTGAAAG CGGCAGTTTT 
CAGTTCTCTA CTGCGCTCGA AGACATTCAC ATGAATGTCG AAGCGCGCCT CAAAGAGATC 
ATTGGCGAGC CTGCAGGTCG TCTGCATACA GGTCGCTCGC GCAACGACCA GGTCGCAACC 
GATTTCAAAC TCTGGGTGCG CGACCAATTC GATGCCGCTG AAAAGGGTCT TCTCGCGCTG 
ATCAAAGCGC TGGTCGATCA GGCCGAGGCT GGCGCGGATT GGGTGATGCC GGGCTTTACC 
CATCTGCAAA CCGCGCAGCC GGTCACATGG GGGCATCACA TGATGGCCTA TGTGGAGATG 
TTTGGCCGCG ACCTCAGCCG GGTGCGCGAT GCGCGCAAGC GCATGAACGA GTCGCCCCTG 
GGTTCTGCGG CGCTGGCAGG GACTTCGTTC CCGATTGATC GCGAGATGAC CGCCAAGGCG 
CTGGGGTTTG ATCGCCCGAC GGCCAATTCG CTCGATGCGG TGTCGGATCG TGACTTCGCG 
CTGGAGTTCC TCTCGGTTGC CTCTATCTGC GCCATGCATC TGTCGCGCTT TGCCGAAGAA 
CTGGTGATCT GGTCCTCGGC GCAGTTCCGC TTTGTGACGC TTTCGGATCG TTTCTCCACT 
GGCTCCTCGA TCATGCCGCA AAAGAAAAAC CCAGACGCCG CCGAACTGAT CCGCGCCAAG 
GTGGGACGGA TCTTTGGCGC TAACACGGCG CTGATGATGG TGATGAAGGG CCTGCCGCTG 
GCCTATTCCA AGGACATGCA GGAAGACAAA GAGCAGGTCT TTGACGCCGC CGATAACTGG 
ATGCTCGCAC TTGCTGCGAT GGAAGGCATG GTGAAGGACA TGACCGGCAA CCGCGAAAGC 
CTTGCGGCCG CGGCGGGGTC CGGTTTCTCG ACGGCCACCG ATCTGGCGGA CTGGATGGTG 
CGGGTCCTGA AAGTGCCGTT CCGGGATGCC CACCATGTGA CCGGCGCGCT CGTCGCGATG 
GCCGAGGGCC GCGGCGTGGA TCTGCCGGAT CTGAGCCTTG AAGACATGAA GTCTGTGCAT 
GAGGGCATCA CCGAGGATAT CTTTACCGTG TTGGGCGTGG AGAATTCAGT AAACTCGCGC 
ATGTCTTACG GCGGCACCGC TCCCGCGCAG GTACGCGCGC AGGTGGCGCG TTGGAAAGAG 
ATCTTGGGCT AA

Protein sequence

MTDKTSNQMW GGRFAAGPDA IMEAINASIG FDQRMAAQDI AGSRAHAAML AATGVITDND 
AEAIREGLLT VLSEIESGSF QFSTALEDIH MNVEARLKEI IGEPAGRLHT GRSRNDQVAT 
DFKLWVRDQF DAAEKGLLAL IKALVDQAEA GADWVMPGFT HLQTAQPVTW GHHMMAYVEM 
FGRDLSRVRD ARKRMNESPL GSAALAGTSF PIDREMTAKA LGFDRPTANS LDAVSDRDFA 
LEFLSVASIC AMHLSRFAEE LVIWSSAQFR FVTLSDRFST GSSIMPQKKN PDAAELIRAK 
VGRIFGANTA LMMVMKGLPL AYSKDMQEDK EQVFDAADNW MLALAAMEGM VKDMTGNRES 
LAAAAGSGFS TATDLADWMV RVLKVPFRDA HHVTGALVAM AEGRGVDLPD LSLEDMKSVH 
EGITEDIFTV LGVENSVNSR MSYGGTAPAQ VRAQVARWKE ILG