Gene Dole_0121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0121
Symbol
ID	5692936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	132858
End bp	136085
Gene Length	3228 bp
Protein Length	1075 aa
Translation table	11
GC content	62%
IMG OID	641262698
Product	carbamoyl-phosphate synthase, large subunit
Protein accession	YP_001528008
Protein GI	158520138
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0458] Carbamoylphosphate synthase large subunit (split gene in MJ)
TIGRFAM ID	[TIGR01369] carbamoyl-phosphate synthase, large subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAAAC GGACCGACAT AGAAAAAATT CTGATCATCG GGGCCGGCCC CATCATCATC 
AGCCAGGCCT GCGAGTTTGA CTACTCCGGC ACCCAGGCGT GCAAGGCGTT AAAGGAAGAG 
GGCTATTCCG TGGTGCTGGT CAACAGCAAC CCGGCCACCA TCATGACCGA CCCCGAGTTT 
GCCGACGCCA CCTACATTGA GCCGGTGACG CCCGAGGCCG TGGCCGCCAT CATCGAAAAG 
GAGCGGCCCT GCGCCATTCT GCCCACCCTG GGGGGCCAGA CCGGCCTGAA CACGGCCGTG 
GCAGTTGCCG AGATGGGGGT GCTGGAAAAG TTTAACGTGG AGATGATCGG GGCGTCGCTT 
TCCGCCATCA AAAAGGCCGA GGACCGGGAC CTGTTCCGAA AGGCCATGAA CAACATCGGC 
CTGCGCATTC CCAGAAGCGG CATTGCCACC AGCATGGACC AGGTGCGGGC CATTGCCGAT 
GAGATCGGTC TGCCCCTGAT CGTGCGGCCC AGCTTTACCC TGGGCGGCAC CGGCGGCGGC 
GTGGCCCACA CGCAGGCCGA GCTGGACGCC CTGTCCGCCG GCGGCCTGGA GGCCAGCCTC 
ATAAACCAGG TGATGATCGA AGAGTCGGTG GTGGGCTGGA AAGAGTACGA GCTGGAGGTG 
ATGCGGGACC GGGCGGACAA CGTGGTGATC ATCTGTTCCA TTGAGAACCT TGACCCCATG 
GGGGTCCACA CCGGGGAAAG CATCACCGTG GCCCCGATCC AGACCCTTTC CGACAAAGAG 
TACCAGGTCA TGCGGGACGC CTCCATTGCC ATCATGCGGG AGATCGGGGT GGACACCGGC 
GGCTCCAATG TCCAGTTTGC CGTCAACCCG GCCAACGGCG AGATGGTGGT GGTGGAGATG 
AACCCCAGGG TGTCGCGCAG CTCGGCCCTG GCCTCCAAGG CCACGGGCTT TCCCATTGCC 
AAGATCGCGG CCAAGCTGGC CGTGGGCTAT ACCCTGGACG AAATCGCCAA CGACATCACC 
GGCGAAACAC GGGCCGCGTT TGAGCCGACC CTGGACTACT GCGTGGTCAA GATTCCGCGC 
TGGACCTTTG AAAAGTTTCC GGAAACAAAA GACGAGCTCT CCACCTCCAT GAAGTCCGTG 
GGCGAAACCA TGGCCATCGG CCGGACTTTT AAAGAGGCGT TGCAGAAGGG CATCCGGTCC 
CTTGAGATCT CCCGGTTCGG CCTGGGGGCC GACGGCGCGG ATAAAATCGA CCCGTCGATC 
CAGGAGATCA CGGACAAACT GGCCACACCC AACTCCGAGC GGCTGTTCTA CCTTCGGTAT 
GCCCTTCAGA AGGGTTTTAC CATTGACGAC ATTTACCGGC TCACCCGCAT CGACCCCTGG 
TTTTTAGACC AGATCGAAAA GATACTTTTT GTTGAAAAAA CACTGATCGA GCATAAAGAC 
AACCTTTCCG CCGACCTTTT GTGGCGTGCC AAGCGGGAGG GTTTTTCCGA TGTTCAGCTG 
GCCCATATCA CGGGAAAGAC CGAAGAGGAG ATTCGCGCGC TCCGTTACGA AGCGGGCCTG 
CGGCCGGTCT ACAAGCTGGT GGACACCTGC GCCGCGGAGT TCAAGGCGGC CACGCCGTAT 
TACTACTCCA CCTACGAGAC GGAAAACGAG GCCCGGGTGT CGGACCGCAA AAAGGTGGTG 
ATCCTGGGCG GGGGTCCCAA CCGCATCGGC CAGGGCATTG AATTTGACTA CTGCTGCGTG 
CACGCCTCCT TTGCCCTGCG CGAAGAGGGG GTGGAGAGCA TCATGGTCAA CAGCAACCCC 
GAGACCGTGA GCACCGACTA TGACACCTCG GACAAGCTCT ATTTCGAGCC CCTTACCGTG 
GAGGATGTGC TCCACATCAT TGACACGGAA AAGTGCGACG GCGTGATCGT CCAGTTCGGG 
GGCCAGACCC CGCTTAATAT CGCCGAGGCC CTTGCCCGTG CCGGGGCCCC CATTATCGGC 
ACCTCGCCTG AATCCATTCG CCGCAGCGAG GACAGAAAGT TTTTCGCCGC CATGCTCAGC 
AAGCTGGGCC TGCTTCAGCC GCCCAACGGC ACGGCGGTCA ACGTGGAAGA GGCCGCGGCC 
ATTGCCCAAA ACCTGGGATA CCCGGTGATC GTGCGGCCGT CGTTTGTGCT GGGGGGCCGG 
GCCATGAAGA TCGTCTACAC CCCGGCGGAG CTGGCCAACT TTGCCCGCCA CGCCATCAAG 
GCCTCGCCCA AACATCCCAT CCTGGTGGAC AAGTTTTTAG AAGACGCCAT TGAGCTGGAC 
GTGGACGCCA TTTCCGACAC CACCGGCCAT ACCGTGATCG GCGGCATCAT GGAGCATATC 
GAGGAGGCGG GCATTCACTC CGGCGACTCG GCCTGCGTGC TGCCGCCCCA CAGCGTCAAG 
CCCCATGTGA TCGACGAGAT CATTCGGGCC ACCAAGGCCA TGGCCGCTGA ACTGAAAGTG 
GTGGGCCTGA TGAACGTGCA GTACGCGGTC AAGGGCGACA CCCTTTACGT GATCGAGGTC 
AACCCCCGGG CCTCCCGCAC CGTGCCCTTT GTCAGCAAGG CCACCGGCGT TGCCCTGGCC 
AAGGCCGCCA CAAAAGTGAT GCTGGGCCGG ACGTTAAAGG AGCTGGGCAT TGTGGACGAC 
GCCTGGCGAA CCGCGCATAT CGCGGTCAAG GAGGCGGTGT TTCCCTTTAA CCGGTTCCCC 
GACGTGGACA CCCTGCTGGG CCCGGAGATG AAGTCCACCG GCGAGGTCAT GGGCCTGGAT 
ATGGATTTCG GCGCCGCCTT TGCCAAGGCC CAGCTGGGGG CCGGCCAGAA ACTGCCGGTC 
AAAGGAAACG TTTTTATCAG CGTTCAGGAC AAAGACAAGC GGGCCACGGC CGGCATTGCC 
CGGCAGTTGA GCGACGCCGG GTTTGAGATC GTGGCCACCG CCGGTACGGC GGCGTTTTTA 
AAAGAGCAGC GCATTGCCGT CCGGCCCATC AACAAGGTGT CTGATGGCCA CCCCCACGTG 
GTGGACGCCA TTGTCAACGG AGAGATTCAA CTGGTGATCA ACACCGGCAC GGGCCAGGAC 
TCCCAGGTGA AGCGGGACGG GTACATGATC CGGCGCACCA CGCTGCGGTG CCAGGTGCCC 
TATGCCACCA CCCTGCCCGG TGCCCTGGCC GTGTGCCGCG GCATTCTCCA GCTCAAGAAA 
CAGGCCCTGG GTGTAAAATC GATTCAGGAG TATCATCAAA AGCCATGA

Protein sequence

MPKRTDIEKI LIIGAGPIII SQACEFDYSG TQACKALKEE GYSVVLVNSN PATIMTDPEF 
ADATYIEPVT PEAVAAIIEK ERPCAILPTL GGQTGLNTAV AVAEMGVLEK FNVEMIGASL 
SAIKKAEDRD LFRKAMNNIG LRIPRSGIAT SMDQVRAIAD EIGLPLIVRP SFTLGGTGGG 
VAHTQAELDA LSAGGLEASL INQVMIEESV VGWKEYELEV MRDRADNVVI ICSIENLDPM 
GVHTGESITV APIQTLSDKE YQVMRDASIA IMREIGVDTG GSNVQFAVNP ANGEMVVVEM 
NPRVSRSSAL ASKATGFPIA KIAAKLAVGY TLDEIANDIT GETRAAFEPT LDYCVVKIPR 
WTFEKFPETK DELSTSMKSV GETMAIGRTF KEALQKGIRS LEISRFGLGA DGADKIDPSI 
QEITDKLATP NSERLFYLRY ALQKGFTIDD IYRLTRIDPW FLDQIEKILF VEKTLIEHKD 
NLSADLLWRA KREGFSDVQL AHITGKTEEE IRALRYEAGL RPVYKLVDTC AAEFKAATPY 
YYSTYETENE ARVSDRKKVV ILGGGPNRIG QGIEFDYCCV HASFALREEG VESIMVNSNP 
ETVSTDYDTS DKLYFEPLTV EDVLHIIDTE KCDGVIVQFG GQTPLNIAEA LARAGAPIIG 
TSPESIRRSE DRKFFAAMLS KLGLLQPPNG TAVNVEEAAA IAQNLGYPVI VRPSFVLGGR 
AMKIVYTPAE LANFARHAIK ASPKHPILVD KFLEDAIELD VDAISDTTGH TVIGGIMEHI 
EEAGIHSGDS ACVLPPHSVK PHVIDEIIRA TKAMAAELKV VGLMNVQYAV KGDTLYVIEV 
NPRASRTVPF VSKATGVALA KAATKVMLGR TLKELGIVDD AWRTAHIAVK EAVFPFNRFP 
DVDTLLGPEM KSTGEVMGLD MDFGAAFAKA QLGAGQKLPV KGNVFISVQD KDKRATAGIA 
RQLSDAGFEI VATAGTAAFL KEQRIAVRPI NKVSDGHPHV VDAIVNGEIQ LVINTGTGQD 
SQVKRDGYMI RRTTLRCQVP YATTLPGALA VCRGILQLKK QALGVKSIQE YHQKP