Gene Ndas_3484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3484
Symbol
ID	9247353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4176153
End bp	4177601
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	71%
IMG OID
Product	argininosuccinate synthase
Protein accession	YP_003681391
Protein GI	297562417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.627119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAGG TACTCACTTC CCTCCCCGTC GGCGAGCGCG TCGGTATCGC CTTCTCCGGT 
GGCCTCGACA CCTCGGTGGC GGTCGCGTGG ATGCGCGACA AGGGCGCCGT CCCGTACGCC 
TACACCGCCG ACATCGGCCA GTACGACGAA CCCGACATCG CCTCGGTCCC CGGCCGCGCC 
ACCGCCTACG GCGCCGAGGG CGCCCGCCTG GTGGACGGCC GGGAGGCGCT GGTGGAGGAG 
GGTTTCGCGG CGCTGGCCTG CGGAGCCTTC CACATCCGCT CCGGCGGCCG CACCTACTTC 
AACACCACCC CCCTCGGGCG GGCCGTCACG GGCACCCTGC TGGTGCGCGC GATGCTCGAG 
GACGGCGTGC AGATCTGGGG CGACGGGTCC ACCTTCAAGG GCAACGACAT CGAGCGGTTC 
TACCGCTACG GCCTGCTCGC CAACCCCTCC CTGCGGATCT ACAAGCCGTG GCTGGACGCC 
GACTTCGTCA ACGAGCTCGG CGGCCGCAAG GAGATGTCGG AGTGGCTGCT GGCCCACGGC 
CTGCCCTACC GGGACAGCAC CGAGAAGGCC TACTCCACCG ACGCCAACAT CTGGGGCGCC 
ACGCACGAGG CCAAGGCGCT CGAACACCTC GACACCGGCA TCGAGATCGT CGAGCCCATC 
ATGGGCGTGC GGTTCTGGGA CCCCGAGGTC GAGATCACCC CCGAGGACGT CACGATCGGC 
TTCGAGCAGG GCCGCCCGGT GACCGTCAAC GGCAAGACCT TCGCCACCGC CGTCGACCTG 
GTCAACGAGG TCAACGCCAT CGGCGGCCGG CACGGCCTGG GCATGTCGGA CCAGATCGAG 
AACCGCGTCA TCGAGGCCAA GAGCCGCGGC ATCTACGAGG CCCCGGGCAT GGCGCTGCTG 
CACGCGGCCT ACGAACGGCT GGTCAACGCG GTCCACAACG AGGACACCCT CGCCAGCTAC 
CACAACGACG GCCGACGGCT CGGCAGGCTG CTCTACGAGG GCCGCTGGCT GGAGCCCCAG 
GCGCTGATGC TGCGCGAGGC CCTCCAGCGC TGGGTGGGCA CGGCGGTCAC CGGCGAGGTG 
ACCCTGCGGC TGCGGCGCGG CGAGGACTAC TCCCTCATGG ACACCACCGG GGCGGCGTTC 
AGCTACCACC CGGACAAGCT GTCCATGGAG CGGACCGAGG ACTCCGCGTT CGGCCCGGTC 
GACCGCATCG GCCAGCTGAC CATGCGCAAC CTCGACATCG CGGACTCCCG CGCCAAGCTG 
GAGGAGTACT CCAGGGTCGG CATGGTCGGC ACCTCGCACC CGACGTCGAT CGGCGCCGCC 
CAGGCGGCCT CGACCGGGCT CATCGGCGCG ATGCCCGAGG GCGGCGCCGA GGCGATCGCC 
TCCCGCGGCC AGGCCCCCGA GAGCGACGAC CTGCTCGACC ACGCCGCGAT GGAGTCCGGC 
AACGACTGA

Protein sequence

MSKVLTSLPV GERVGIAFSG GLDTSVAVAW MRDKGAVPYA YTADIGQYDE PDIASVPGRA 
TAYGAEGARL VDGREALVEE GFAALACGAF HIRSGGRTYF NTTPLGRAVT GTLLVRAMLE 
DGVQIWGDGS TFKGNDIERF YRYGLLANPS LRIYKPWLDA DFVNELGGRK EMSEWLLAHG 
LPYRDSTEKA YSTDANIWGA THEAKALEHL DTGIEIVEPI MGVRFWDPEV EITPEDVTIG 
FEQGRPVTVN GKTFATAVDL VNEVNAIGGR HGLGMSDQIE NRVIEAKSRG IYEAPGMALL 
HAAYERLVNA VHNEDTLASY HNDGRRLGRL LYEGRWLEPQ ALMLREALQR WVGTAVTGEV 
TLRLRRGEDY SLMDTTGAAF SYHPDKLSME RTEDSAFGPV DRIGQLTMRN LDIADSRAKL 
EEYSRVGMVG TSHPTSIGAA QAASTGLIGA MPEGGAEAIA SRGQAPESDD LLDHAAMESG 
ND