Gene TM1040_1869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1869
Symbol
ID	4077894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1969271
End bp	1971301
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	62%
IMG OID	638007185
Product	carbamoyl-phosphate synthase L chain, ATP-binding
Protein accession	YP_613864
Protein GI	99081710
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGAGA AGATCCTGAT CGCCAACCGG GGGGAAATTG CCTGTCGCGT CATCAAGACC 
GCGCGCAAGA TGGGCATCAA GACCGTCGCC ATTTATTCCG ACGCCGACCG TCAGGCGCTG 
CATGTGCAGA TGGCGGATGA GGCCGTGCAT GTGGGCCCTG CGCCTGCCAA CCAATCCTAC 
ATCGTCATCG ACAATGTGAT GGCCGCGATC AAATCCTCGG GCGCGCAGGC GGTGCATCCG 
GGCTATGGCT TCCTGTCGGA AAACGCCAAA TTCGCCGAGG CGCTGGAGGC CGCAGGCGTC 
GCCTTTGTTG GCCCGCCCAA AGGCGCGATT GAGGCGATGG GGGACAAGAT CACCTCGAAG 
AAAATCGCCC AGGAAGCAGG CGTGTCGACC GTGCCCGGCT ACATGGGCCT GATCGCGGAC 
GCCGATGAGG CGGTGAAGAT CTCCAACGAG ATCGGCTATC CGGTGATGAT CAAGGCCTCT 
GCCGGGGGCG GCGGCAAGGG CATGCGGATT GCCTGGACCG ACGAAGAGGC CCGCGAGGGC 
TTTCAGTCCT CCAAAAACGA GGCCGCGAAC TCCTTTGGCG ATGACCGGAT CTTCATTGAG 
AAATTCGTGA CGCAACCGCG CCACATCGAA ATTCAGGTGC TCTGCGATGC CCATGGCAAC 
GGCGTTTACT TGGGCGAGCG CGAATGCTCC ATCCAGCGCC GCAACCAGAA GGTCGTCGAA 
GAGGCGCCGA GCCCCTTCCT CGATGAAGAG ACCCGCCGCG CCATGGGCGA GCAATCCGTC 
GCGCTGGCCA AGGCCGTGGG CTATGCCTCT GCGGGCACCG TGGAATTCAT CGTCGACGGC 
GACAAGAACT TCTACTTCCT CGAGATGAAC ACCCGCCTGC AGGTGGAACA TCCCGTGACC 
GAACTCATCA CTGGTGTGGA CCTTGTGGAG CAGATGATCC GCGTGGCCGC CGGCAAGGAG 
CTGTCGATCA CTCAGAATGA TGTCAAACTT ACCGGCTGGG CGATTGAAAA CCGCCTTTAT 
GCCGAAGATC CCTATCGCAA CTTCCTGCCC TCCATCGGGC GTCTCACCCG CTATCGTCCC 
CCGGCAGAAA CCGCGGCCTA CACGCCCGGC GTCGCGCCCG GAGATGCGGG CGATGTGGTC 
GTGCGTAACG ACACCGGCGT CTATGAAGGC GGTGAGATTT CAATGTATTA CGACCCGATG 
ATCGCCAAGC TCTGCACCTG GGCACCGACC CGTGATGCGG CGATCGAGGC GATGCGCGCG 
GCGCTTGACA GTTTCGAGGT CGAAGGCATC GGTCACAACC TGCCGTTCCT TTCGGCGGTG 
ATGGATCATC CGAAGTTTGT TTCGGGCGAG ATGACCACCG CCTTTATCGC CGAGGAATAC 
CCCGAGGGGT TTGACGGCGT CGATCTGCCG GAAAGCGATC TGAAGCGCAT CGCGGCCTCT 
TGTGCGGCCA TGCACCGGGT TGCCGAAATC CGCCGCACGC AGGTCTCGGG CCGCATGGAC 
AACCACGAAC GCCGGGTGGG CAACACCTGG GTGGTGGCCA TTGGCGGGCA GACCTATGAG 
CTGCGTGTTG CCGCCGATCC CGAAGGCGCA ACCGTGCGCT TTGAGGATCA AAGCGAGATC 
CGCGTGAGTT CCGATTGGAC GCCGGGTGAC AGCCTTGCCC ATGTGGATGC GGATGGCACG 
CCTCTGGTGC TGAAGGTCGA CAAGATCACC CAAGGCTTCC GCGTGCGCAG CCGGGGCGCG 
GACCTCAAGG TGCATGTGCG CCGTCCGCGT CAGGCCGAAC TGGCCGCCTT GATGCCCGAA 
AAACTGCCGC CCGATACCTC CAAGATGCTT CTGTGCCCAA TGCCCGGTCT TGTTGTGAAG 
ATCAACGTCG AGGTGGGCGA AGAAGTGCAG GAGGGGCAGG CGCTCTGCAC CATCGAGGCG 
ATGAAGATGG AAAACATCCT GCGCGCCGAG AAAAAATCCG TGGTCTCCAA AATCAATGCG 
GCGGCAGGCG ACAGCCTCGC GGTGGACGAT GTGATCATCG AATTCGAATG A

Protein sequence

MFEKILIANR GEIACRVIKT ARKMGIKTVA IYSDADRQAL HVQMADEAVH VGPAPANQSY 
IVIDNVMAAI KSSGAQAVHP GYGFLSENAK FAEALEAAGV AFVGPPKGAI EAMGDKITSK 
KIAQEAGVST VPGYMGLIAD ADEAVKISNE IGYPVMIKAS AGGGGKGMRI AWTDEEAREG 
FQSSKNEAAN SFGDDRIFIE KFVTQPRHIE IQVLCDAHGN GVYLGERECS IQRRNQKVVE 
EAPSPFLDEE TRRAMGEQSV ALAKAVGYAS AGTVEFIVDG DKNFYFLEMN TRLQVEHPVT 
ELITGVDLVE QMIRVAAGKE LSITQNDVKL TGWAIENRLY AEDPYRNFLP SIGRLTRYRP 
PAETAAYTPG VAPGDAGDVV VRNDTGVYEG GEISMYYDPM IAKLCTWAPT RDAAIEAMRA 
ALDSFEVEGI GHNLPFLSAV MDHPKFVSGE MTTAFIAEEY PEGFDGVDLP ESDLKRIAAS 
CAAMHRVAEI RRTQVSGRMD NHERRVGNTW VVAIGGQTYE LRVAADPEGA TVRFEDQSEI 
RVSSDWTPGD SLAHVDADGT PLVLKVDKIT QGFRVRSRGA DLKVHVRRPR QAELAALMPE 
KLPPDTSKML LCPMPGLVVK INVEVGEEVQ EGQALCTIEA MKMENILRAE KKSVVSKINA 
AAGDSLAVDD VIIEFE