Gene Caul_3211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3211
Symbol
ID	5900666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3472396
End bp	3473763
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	69%
IMG OID	641563716
Product	argininosuccinate lyase
Protein accession	YP_001684836
Protein GI	167647173
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.575771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGGCG GCAGGTTCTC GGCCAAGCCG GCGGAGCTGA TGCAGGCGAT CAATGTCAGC 
ATCGGCTTCG ACAAGCGCCT TTGGGCGCAG GACTTGGCGG GCTCCCGCGC CCATGCCCGG 
ATGTTGATCA GCCAAGGCGT GATTGCAAGG GACGACGGCG AGGAAATCCT CAAGGGCCTG 
GACGCCATCG AGGGCGAGAT CGTCGCCGGG GCCTTCCCGT TCCGTGACGA GTACGAAGAC 
ATCCACATGA ACATCGAGGC GCGGTTGCGC GAGCTGATCG GCCCGACGGC CGGCCGGCTG 
CACACCGCCC GCTCGCGCAA CGACCAGGTG GCCGTCGATT TCCGGCTGTG GGTGCGCGAG 
GCCTGCGACC GTTCCGCGGC CCAACTGGAG GCTTTGCAAA AGGCCCTGGT CGCCCAGGCC 
GAACAGTATG CCGACGCCCT GATGCCGGGC TTCACCCATC TGCAGCCGGC CCAGCCGGTG 
ACCTTCGGCC ACCACCTGAT GGCCTATGTC GAGATGTTCG GCCGCGACGC CTCGCGGTTC 
CGTGACGCCC GCGTCCGGAT GAACGAGTGC CCGCTGGGCG CCGCGGCCCT GGCCGGCTCG 
CCCTTCCCGA TCGACCGCCA CGCCACGGCC GCCAGCCTCG GCTTCGACCG TCCGACCGCC 
AATTCGCTGG ACAGCGTCTC GGCCCGCGAC TTCGCCCTGG AGGCCCTGTC TGCCGCCTCG 
ATCTGCGCCA CGCACCTGTC GCGCCTGGCC GAGGAGATCG TGCTGTGGAC GACGCCGATG 
TTCGGCTTCG TCAAGCTGAC CGACGCCTTC ACGACCGGCA GCTCGATCAT GCCGCAGAAG 
AAGAACCCCG ACGCCGCCGA GCTGGTCCGC GCCAAGGTCG GCCGGATCCT GGGGTCGCTC 
ACGACGCTGA CCGTGGTGAT GAAGGGCCTG CCGCTGGCCT ATTCCAAGGA CATGCAGGAG 
GACAAGGTCC CGACCTTCGA GGCCTTCGAC GCGCTGGAGC TGAGCTTGCT GGCCATGGCC 
GGCATGGTGT CGGACCTGAC GCCCAACACC GAAAAGATGG CCGCCGCCGC CGGCGCGGGC 
TTCTCGACCG CCACGGACCT GGCCGATTGG CTGGTCCGCG AACTGAACAT GCCTTTCCGC 
GACGCCCACC ACGTGACAGG CTCGGCGGTG AAGGCGGCGG AGACTCTTGG CGTGGATCTG 
GCGGAACTGT CGCTCGCCGA CTTGCGGGCG ATCGAGCCGC GCATCACCTC TGACATCTAC 
ACCGTGCTCA CGCCCGCCGC CTCGGCGGCC AGCCGCATCA GCTACGGCGG GACCGCTCCC 
GCCCAGGTTC GCGCCCAGAT CGCGCGTTGG AAGGAACTGC TCGGATGA

Protein sequence

MWGGRFSAKP AELMQAINVS IGFDKRLWAQ DLAGSRAHAR MLISQGVIAR DDGEEILKGL 
DAIEGEIVAG AFPFRDEYED IHMNIEARLR ELIGPTAGRL HTARSRNDQV AVDFRLWVRE 
ACDRSAAQLE ALQKALVAQA EQYADALMPG FTHLQPAQPV TFGHHLMAYV EMFGRDASRF 
RDARVRMNEC PLGAAALAGS PFPIDRHATA ASLGFDRPTA NSLDSVSARD FALEALSAAS 
ICATHLSRLA EEIVLWTTPM FGFVKLTDAF TTGSSIMPQK KNPDAAELVR AKVGRILGSL 
TTLTVVMKGL PLAYSKDMQE DKVPTFEAFD ALELSLLAMA GMVSDLTPNT EKMAAAAGAG 
FSTATDLADW LVRELNMPFR DAHHVTGSAV KAAETLGVDL AELSLADLRA IEPRITSDIY 
TVLTPAASAA SRISYGGTAP AQVRAQIARW KELLG