Gene Ndas_3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3103
Symbol
ID	9246959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3717289
End bp	3718482
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	73%
IMG OID
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_003681018
Protein GI	297562044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.450122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACAG AACAGAACAC CCGGGCCGCC CACGGCCCGG CGGAGGAGGG GGCGAACGTG 
TCCGAGAGCG GACCCGCGAT TCTGGTACTC GAGGACGGCC GTGTCTTCCA CGGCCGCTCC 
TTCGGCGCCA CCGGGGAGAC CTTCGGCGAG GCGGTCTTCA ACACCGGCAT GACCGGCTAC 
CAGGAGACCC TCACCGACCC CTCGTACCAC CGCCAGATCG TGGTGATGAC CGCCCCCCAC 
ATCGGCAACA CCGGCGTCAA CGACGACGAC CCCGAGTCCG GCCGCGTCTG GGTCGCCGGG 
TACGTCGTGC GCGAGCCCGC CCGCATCACC TCCAACTGGC GGGCCGAGCG CACCCTGGAC 
GAGGAGCTGC GCCGCCAGGG CGTGGTCGGC ATCGCCCTCA CCGGCACCCG CGCCCTCACC 
CGCCACCTGC GCGACAAGGG CGTCATGCGC GCCGCCATCA GCACCACCGA GACCGACCCG 
CGGGCCCTGC TGGAGCGCGT GCGCCAGCAG CCCACCATGG CCGGGGCCGA CCTGGCCGCC 
GAGGTCAGCA CCGGCGAGCC CTACGAGGTC CTGCCGCCCG AGGGCGTGAC CGCCCGCTTC 
CACGTCGCCG CCGTGGACCT GGGCATCAAG GCCATGACCC CCCAGCGCCT GGCCGAGCGG 
GGGTGCCGGG TCACCGTGCT GCCCTCCACC GCCACCGCCG AGGAGATCCT CGCCCTGGAC 
CCGGACGGGG TGTTCTTCAG CAACGGCCCC GGCGACCCCG CCACCGCCGA CGGGCCCGTC 
ACCGCCATGC GCGGCGTCCT GGACGCGGGC AGGCCGCTCT TCGGCATCTG CTTCGGCAAC 
CAGATCCTGG GGCGCGCCCT GGACCTGGGC ACCTACAAGC TGCCCTTCGG GCACCGGGGC 
GTCAACCAGC CGGTGATCGA CACCCGCTCC GGCAGGGTCG CCATCACCAG CCAGAACCAC 
GGCTTCGCCG TCGAGGCCCC CCTCGACGAG CCCTTCGACA CCCCCTACGG CCGGGCCGAG 
GTCAGCCACA TCGGCCTCAA CGACCGCGTC GTCGAGGGCC TGCGGCTGCT GGACCGCCCC 
GCGTTCAGCG TCCAGTTCCA CCCGGAGGCC GCCGCCGGCC CCCACGACGC CGCCGAACTC 
TTCGACGCGT TCGTCGACCT GATGTCCGCC CAGCCCGCTC CGGCTGCCAA GTAG

Protein sequence

MSTEQNTRAA HGPAEEGANV SESGPAILVL EDGRVFHGRS FGATGETFGE AVFNTGMTGY 
QETLTDPSYH RQIVVMTAPH IGNTGVNDDD PESGRVWVAG YVVREPARIT SNWRAERTLD 
EELRRQGVVG IALTGTRALT RHLRDKGVMR AAISTTETDP RALLERVRQQ PTMAGADLAA 
EVSTGEPYEV LPPEGVTARF HVAAVDLGIK AMTPQRLAER GCRVTVLPST ATAEEILALD 
PDGVFFSNGP GDPATADGPV TAMRGVLDAG RPLFGICFGN QILGRALDLG TYKLPFGHRG 
VNQPVIDTRS GRVAITSQNH GFAVEAPLDE PFDTPYGRAE VSHIGLNDRV VEGLRLLDRP 
AFSVQFHPEA AAGPHDAAEL FDAFVDLMSA QPAPAAK