Gene Caul_4763 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4763
Symbol
ID	5902225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5147620
End bp	5148843
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	66%
IMG OID	641565283
Product	argininosuccinate synthase
Protein accession	YP_001686381
Protein GI	167648718
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.235186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAACA AGCCCGTGAA GAAGGTCGTG CTCGCCTATT CTGGCGGTCT CGACACCTCG 
ATCATCCTCA AGTGGCTGCA GACCGAGTAC GGGGCGGAGG TCGTCACCTT CACCGCCGAC 
CTGGGCCAGG GCGAGGAAAT CGAGCCGGCG CGCGCCAAGG CGCTGGCGGC GGGCGTGAAG 
CCGGAAAACA TCTTCATCGA GGACGTGCGC GAGGAGTTCG TGCGCGATTA CGTGTTCCCG 
ATGTTCCGCG CCAACACGGT CTATGAGGGC CAGTACCTGC TGGGCACCTC GATCGCCCGT 
CCGCTGATCG CCAAGAAGCA GATCGAGATC GCCCGCAAGG TCGGGGCCGA CGCGGTCAGC 
CACGGCGCCA CCGGCAAGGG CAACGATCAG GTCCGCTTCG AACTGGGCTA CTACGCCCTC 
GAGCCCGACA TCCACGTGAT CGCCCCCTGG CGCGAATGGG ACTTCAAGTC CCGCGAGGCC 
CTGCTGGACT TCGCCGAGAA GCACCAGATC CAGATCGCCA AGGACAAGCG CGGCGAGGCG 
CCGTTCAGTG TCGACGCCAA CCTGCTGCAC AGCTCGTCGG AGGGCAAGGT CCTGGAGGAT 
CCGGCCGTCG AGGCCCCCGA GTTCGTCCAC ATGCGCACCA TCGCGCCGGA AGACGCGCCC 
GACAAGCCGC ACATCTTCAC CCTCGATTTC GAGCGCGGCG ACGCGGTGGC CATCGACGGC 
GTGGCCATGA GCCCGGCCAC GATCCTGACC AAGCTCAACG AACTGGGTCA CGACAACGGC 
GTCGGTCGCC TGGACCTGGT CGAGAACCGC TTCGTCGGCA TGAAGTCGCG CGGCGTTTAC 
GAGACCCCGG GCGGTACGAT CCTGCTGGCC GCCCACCGGG GCATCGAATC GATCACCCTG 
GATCGCGGCT CGATGCACCT GAAGGACGAG CTGATGCCGA AATACGCATC GCTGGTCTAT 
AACGGCTTCT GGTTCTCGCC CGAGCGCGAG ATGCTGCAGG CGGCCATCGA CTACAGCCAG 
GCCAAGGTCG CCGGCCAGGT GCGCGTCAAG CTCTACAAGG GCAATGTCAG CATCATCGGT 
CGCACCAGCC CCTACAGCCT CTACGACCAG GACCTGGTCA CCTTCGAGGA GGGCAAGGTC 
GCCTACGATC ACCGCGACGC CGGCGGCTTC ATCAAGCTCA ACGCCCTGCG CCTGCGCGTG 
CTGGCCAAGC GCGACAAGCG CTGA

Protein sequence

MANKPVKKVV LAYSGGLDTS IILKWLQTEY GAEVVTFTAD LGQGEEIEPA RAKALAAGVK 
PENIFIEDVR EEFVRDYVFP MFRANTVYEG QYLLGTSIAR PLIAKKQIEI ARKVGADAVS 
HGATGKGNDQ VRFELGYYAL EPDIHVIAPW REWDFKSREA LLDFAEKHQI QIAKDKRGEA 
PFSVDANLLH SSSEGKVLED PAVEAPEFVH MRTIAPEDAP DKPHIFTLDF ERGDAVAIDG 
VAMSPATILT KLNELGHDNG VGRLDLVENR FVGMKSRGVY ETPGGTILLA AHRGIESITL 
DRGSMHLKDE LMPKYASLVY NGFWFSPERE MLQAAIDYSQ AKVAGQVRVK LYKGNVSIIG 
RTSPYSLYDQ DLVTFEEGKV AYDHRDAGGF IKLNALRLRV LAKRDKR