Gene TM1040_3024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3024
Symbol
ID	4076597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	3192426
End bp	3193610
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	59%
IMG OID	638008353
Product	2-amino-3-ketobutyrate coenzyme A ligase
Protein accession	YP_615018
Protein GI	99082864
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase [TIGR01822] 2-amino-3-ketobutyrate coenzyme A ligase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.299571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.986535
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAATG CTTTTCTCAG CCACATCAGC GAAACCCTGA CGCAGATCGA AGCCGATGGT 
CTCTACAAGC GCGAGCGAAT GATCACCTCG CCTCAGGGCG GCGAGATCCG GGTTGGGGAC 
CGCGAAGTTA TCAATCTTTG TGCCAATAAC TATCTTGGGC TGGCCGACCA TCCCGATTTG 
ATCGCCGCCG CAAAATCCGT GATGGACGAA AAAGGTTATG GTATGGCCTC TGTGCGCTTC 
ATCTGCGGGA CACAGGATCT GCATCGAACG CTGGAGCAGA AGATAGCAAA TTTTCTCGGC 
AAGGACGATT CGATCCTCTT TGCAGCCTGT TTTGACGCCA ATGGCGGGTT GTTCGAGCCG 
TTGCTCGGCC CTGAAGATGC GATCATTTCC GACAGCCTGA ACCACGCCTC GATCATCGAC 
GGCATCCGTC TTTGCAAGGC ACAGCGCTAT CGCTATGCCA ATAATGACAT GGAGGATCTC 
GAGGCGAAGT TGAAGGACGC GCGTGCCAAG GGCGTGCGCC ACATCATGAT CGCAACCGAT 
GGGGTTTTCT CCATGGATGG CTACCTCGCC AATCTGCCTG CGATCCGGGA GATTGCCGAT 
CGGCATGACG CGATGGTGAT GGTAGATGAC TGTCATGCAA CCGGCTTCAT GGGGCCAAAA 
GGGGCAGGTA CGCCGGATCA CTTCGGCGTG GACGTCGATA TCCTGACCGG CACGCTGGGC 
AAGGCGCTGG GCGGTGCGAT TGGAGGCTAC ATCGCCGGCC CCCAGCCCGT GATCGATCTG 
CTGCGCCAAC GGGCGCGCCC CTATTTGTTC TCAAACTCCC TACCGCCCGC GGTGGTGGCT 
GCCGGGCTGG AGGCGATCCG CCTGGTCGAG GAAGGCGAGA GCCTGCGCCG ACAACTGTTT 
GAAAACGCCA CGATCTGGCG CGAAGGGCTA ACCCGTCTGG GTTTTGACCT GCTGCCCGGA 
GAGCACCCGA TCATCCCGGT GATGCTGGGC GATGCCAAGC TGGCACAGGA AATGGCCAAT 
AAATTGTTTG AAGAGGGCGT CTATGTCTCC GGCTTTTTCT TTCCCGTTGT GCCAAAAGGA 
CAAGCCCGCA TCCGCACCCA GATGAACGCC GCCCTGACCC AAGACGAGTT GAACCGAGCC 
CTGAACGCGT TTGAGCGTGC GGGCAAGGCC TGTGGAGTGA TCTGA

Protein sequence

MSNAFLSHIS ETLTQIEADG LYKRERMITS PQGGEIRVGD REVINLCANN YLGLADHPDL 
IAAAKSVMDE KGYGMASVRF ICGTQDLHRT LEQKIANFLG KDDSILFAAC FDANGGLFEP 
LLGPEDAIIS DSLNHASIID GIRLCKAQRY RYANNDMEDL EAKLKDARAK GVRHIMIATD 
GVFSMDGYLA NLPAIREIAD RHDAMVMVDD CHATGFMGPK GAGTPDHFGV DVDILTGTLG 
KALGGAIGGY IAGPQPVIDL LRQRARPYLF SNSLPPAVVA AGLEAIRLVE EGESLRRQLF 
ENATIWREGL TRLGFDLLPG EHPIIPVMLG DAKLAQEMAN KLFEEGVYVS GFFFPVVPKG 
QARIRTQMNA ALTQDELNRA LNAFERAGKA CGVI