Gene Dole_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0120
Symbol
ID	5692935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	131723
End bp	132865
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	61%
IMG OID	641262697
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_001528007
Protein GI	158520137
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCCC TGCTTGCCCT TGAAGACGGG CGGACCTTTG CCTGCAAAAG CTTTACCGGA 
CCCGGAGAAA CCGGCGGGGA GATCGTGTTT AACACCGGCA TGTCCGGCTA CCAGGAGGTA 
CTTACCGATC CCTCCTACCG GGGCCAGATC GTGACTATGA CCTATCCCCT TATCGGCAAC 
TACGGGGTCA ACCACCAGGA TGTGGAGTCG GACCGGGTCC AGGTGGCCGG TTTTGTGGTG 
CGCGAATACC AGGACTGCCC CAGCAACTTC CGGTCCGAGC AGTCCCTGGC AAAATACCTG 
CAAAGCCAGG GCGTGCTGGG CATCACCGAC CTGGACACCC GTGCCCTGAC CCGCCACCTT 
CGCACAGTAG GGGCGTTGCG GGCCTGCATC TCCACCCACG AACTCGATCC CGCGGCCCTG 
GTAGAAAAGG CGCTTGCCGT GCCGTCCATG GCAGGGTGCG ACCTTGTCAC CGGCGTGTTT 
TCAAAAAAGC CCTATCGCTG GATCAACGGG GCGCCGGCCG CCGTGGACAT GGACCTGGCC 
GATATGGATG AGCGGGTGTG GCATAAAACC GGTGGCTTTC GGGTGGCGGC CTTTGATTTC 
GGCATCAAGT ACAACATTCT GAGAAATCTT GAGGCGGCCG GGTTCCAGGT GCTGGTGGTG 
CCTGCCGGTG CCACGGCCGC CCAGGTAAAA CAGGTCAACC CGGACGGGAT TTTTCTGTCC 
AACGGGCCGG GCGACCCCGA GCCGTTGACC GGGCCGGTGG CCACCATTCG CGAGCTTCTG 
GACTACCGGC CCATGTTCGG CATCTGCCTG GGAAACCAGT TGGCCGGCCT GGCCCTGGGC 
GGCGCCACCT ACAAGCTCAA GTTCGGCCAC CGGGGCGCCA ACCAGCCGGT AAAGGACCTT 
GAAACCGGAA AAATCGAAAT CACCTCCCAG AACCACGGGT TTGCCGTGGA TATCGACAGC 
CTGAAAAAAG AAAATCTCGT GGTGACCCAC ATCAACCTCA ACGACAACAC CCTGGAGGGG 
TTTGCCCACA AAGACATTCC CCTGTTTACC GTCCAGTACC ATCCCGAGGC ATCCCCGGGT 
CCCCACGACG CCCGGTACCT GTTTGACCGG TTCAAAGCCC TGATAGAGAA AACCCATGCC 
TAA

Protein sequence

MKALLALEDG RTFACKSFTG PGETGGEIVF NTGMSGYQEV LTDPSYRGQI VTMTYPLIGN 
YGVNHQDVES DRVQVAGFVV REYQDCPSNF RSEQSLAKYL QSQGVLGITD LDTRALTRHL 
RTVGALRACI STHELDPAAL VEKALAVPSM AGCDLVTGVF SKKPYRWING APAAVDMDLA 
DMDERVWHKT GGFRVAAFDF GIKYNILRNL EAAGFQVLVV PAGATAAQVK QVNPDGIFLS 
NGPGDPEPLT GPVATIRELL DYRPMFGICL GNQLAGLALG GATYKLKFGH RGANQPVKDL 
ETGKIEITSQ NHGFAVDIDS LKKENLVVTH INLNDNTLEG FAHKDIPLFT VQYHPEASPG 
PHDARYLFDR FKALIEKTHA