Gene TM1040_3597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3597
Symbol
ID	4075024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	645205
End bp	646596
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	61%
IMG OID	638005116
Product	hypothetical protein
Protein accession	YP_611826
Protein GI	99078568
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCG AATCCGCTCT TTCCCGCGCC AGCCGCTATT TTGAGGCAGG AGATTTCCAG 
TCCGATCTGG CGCATCTTGT CACCTATCGA AGCGAAAGCC AGAACACCGC GCCCGAGGCG 
CGCATGGAAT GTCGGCGCTA TCTCGAAGAG GCAATGCTGC CGCGGCTGCG TGCGCTCGGA 
TTTGATTGCG AGATCATCGA CAATCCCGAC CCGACCGGCG GTCCCCTGCT GATTGGTGAG 
CGGCGCGAAG GCGAGGCACT CCCCACCATA CTGACCTACG GGCACGGTGA CGCAGTGCTG 
GGACAAGAAG GACGCTGGCG CGAGGGGCTA GAGCCCTGGG TGCTCGTCGA AGAAGGCGAT 
CGCCTCTATG GTCGCGGCAC CGCCGACAAC AAGGGTCAAC ACCTGATCAA CATCGCAGCG 
CTCGAAGCCG TTCTTGCAGA ACGCGGCCAC CTCGGCTTCA ACACGCGCAT TGTCATTGAA 
ATGAGCGAAG AAGTTGGTTC AGTCGGCCTG CCCGACGTGT TCAGAGCCTA CAAGGACCGG 
CTCACAGCAG ATGTTCTCAT CGCCTCTGAT GGCCCCCGGC TGCAGCCCGA CGTGCCAACC 
ATGTTCATGG GTTCGCGCGG GGGCACGACA TTTGATCTTG TGGTTGAAAC GCATGAGGGT 
GCGCATCATT CGGGCAATTG GGGCGGGCTT TTGTCGGACC CGGCCATGAT CCTCGCACAT 
GCGCTGGCCT GTATCACCGA TGTGCGCGGC CAGATCAAAG TGCCCGAATG GCGCCCGGAT 
AGTCTTACCG AGAATGTGCG CATGGCGCTT CGAGACCTCC CTGTCGCGGG AGGACAGGGG 
CCAGCGGTGA ACCCCGACTG GGGCGAAGAA GACCTGACCC CGGCAGAGCG CGTCTTTGGC 
TGGAACAGCT TTACGGTTCT GGCGATGGTT TCGGGTGTGC CAGAAGCGCC TGTCAATGCG 
ATCTCGGGTT GGGCGCGCGC GACGTGTCAG TTGCGATACG TTGTCGGCAC CGACCCGGAG 
GACGTGGTGC CCGCATTGCG GCGCCATTTG GACGCGCATG GCTTCGAGAG CGTCGAAATC 
CGCTGCCACG AACGAGGCTT TTTTGCCGCA ACCCGTCTGG ACCCCGATCA CCCTTGGGCG 
CAGTTCGTTG GAGAGTCGAT CCGCAGGACT TCTGGTGCGC TGCATGTGCT TCCAAACCTT 
GCAGGCTCTT TGCCAAATGA CAGCTTCACC GACATCCTGG AGGTGCCGAC AATTTGGGTG 
CCTCATTCCT ACAGAGGCTG TTCGCAGCAT GCGCCAAACG AACACGTATT GAAATCTGTA 
TACCACGACG CGTTGAGAGT GATGGCCGGA GTCTTCTGGG ACCTTGGCGA ACAGGGCGGA 
CCACTCGCCT GA

Protein sequence

MSRESALSRA SRYFEAGDFQ SDLAHLVTYR SESQNTAPEA RMECRRYLEE AMLPRLRALG 
FDCEIIDNPD PTGGPLLIGE RREGEALPTI LTYGHGDAVL GQEGRWREGL EPWVLVEEGD 
RLYGRGTADN KGQHLINIAA LEAVLAERGH LGFNTRIVIE MSEEVGSVGL PDVFRAYKDR 
LTADVLIASD GPRLQPDVPT MFMGSRGGTT FDLVVETHEG AHHSGNWGGL LSDPAMILAH 
ALACITDVRG QIKVPEWRPD SLTENVRMAL RDLPVAGGQG PAVNPDWGEE DLTPAERVFG 
WNSFTVLAMV SGVPEAPVNA ISGWARATCQ LRYVVGTDPE DVVPALRRHL DAHGFESVEI 
RCHERGFFAA TRLDPDHPWA QFVGESIRRT SGALHVLPNL AGSLPNDSFT DILEVPTIWV 
PHSYRGCSQH APNEHVLKSV YHDALRVMAG VFWDLGEQGG PLA