Gene Caul_3439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3439
Symbol
ID	5900894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3720670
End bp	3721980
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	67%
IMG OID	641563945
Product	adenylosuccinate lyase
Protein accession	YP_001685064
Protein GI	167647401
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGCC GTTATTCCCG CCCCGAAGCC GCCGCCATCT GGTCCAGCCA GACCAAGTAC 
AAGATCTGGT TCGAGATCGA GGCTCACGCC GCCGACGCCA TGGCCGAGAT CGGGGTCATC 
CCCAAGCTCG CCGCCGAGAC GATCTGGGAG AAGGGCCGCG ACGCGGTCTG GGATAGCGAC 
CGGATCGACG AGATCGAGCG CGTCACCAAG CATGACGTCA TCGCCTTCCT GACCCACGTC 
TCGGAGATCG TCGGTCCCGA GGCGCGCTTC CTGCACCAGG GCATGACCAG CTCGGACGTG 
CTGGACACCT GCTTCGCCGT GCAGCTGAGC AAGGCCACCG ACCTGCTGCT GGAAGATGTC 
GACCTGATCC TGGCCGCGCT GAAGCGCCGG GCGCTGGAAC ACAAGATGAC GGTGTGCGTC 
GGCCGCAGCC ACGGCATCCA CGCCGAGCCG ATCACCTTCG GCCTGAAGCT GGCCGGCTAT 
TACGCCGAGT TCCAGCGCGC CAAGGAGCGC CTGGCCATGG CCAAGTTCGA GATCGCCACC 
TGCGCGATCA GCGGCGCGGT CGGCACCTTC GCCAATGTCG ATCCGCGCGT CGAACAGCAC 
GTGGCCGACA AGATGGGCCT GGTGGTCGAG CCGGTCTCGA CCCAGGTGAT CCCGCGCGAC 
CGCCACGCGG CCTATTTCTG CGCCCTCGGC GTGGTCGCCT CGTCGGTGGA ACGCCTGGCG 
ACCGAGATCC GCCACCTGCA GCGCACCGAG GTGCTGGAGG CCGAGGAGCC GTTCGAGGTG 
GGGCAGAAGG GCAGCTCGGC CATGCCGCAC AAGCGCAACC CGATCCTGAC CGAGAACCTG 
ACGGGTCTGG CCCGGCTGGT GCGCTCGGCC GTGACGCCCG CCCTGGAGAA CGTCGCCCTC 
TGGCACGAGC GCGACATCAG CCACTCGTCG GTCGAGCGCG GCATCGGGCC GGACGCCACC 
ATCCACCTCG ACTTCGCCCT GCGCCGCCTG GCCGGGGTGA TCGAGCGCTT CAACATCTAT 
CCCGACAACA TGGCCAAGAA TTTGGACAAG CTGGGGGGCC TGGTGTTCTC GCAGCGGGTG 
ATGCTGGCCC TGACCCAGAA GGGCGTGTCG CGCGAGGACG CCTATGCCGC CGTGCAGGGC 
AATTCGATGA AGGTGTGGCG CGGCGAGGGC CGGTTCATCG ACTTCCTGAA GGCCGATCCG 
GTGGTCTCCA AGGCGCTGTC GGACGCCGAG CTCGAGGAGC TGTTCGACTA CGGCTACCAC 
ACCAAGAACG TGGACGTGAT CTTCAAGCGG GTGTTCGGCG AGCAGGGCTG A

Protein sequence

MISRYSRPEA AAIWSSQTKY KIWFEIEAHA ADAMAEIGVI PKLAAETIWE KGRDAVWDSD 
RIDEIERVTK HDVIAFLTHV SEIVGPEARF LHQGMTSSDV LDTCFAVQLS KATDLLLEDV 
DLILAALKRR ALEHKMTVCV GRSHGIHAEP ITFGLKLAGY YAEFQRAKER LAMAKFEIAT 
CAISGAVGTF ANVDPRVEQH VADKMGLVVE PVSTQVIPRD RHAAYFCALG VVASSVERLA 
TEIRHLQRTE VLEAEEPFEV GQKGSSAMPH KRNPILTENL TGLARLVRSA VTPALENVAL 
WHERDISHSS VERGIGPDAT IHLDFALRRL AGVIERFNIY PDNMAKNLDK LGGLVFSQRV 
MLALTQKGVS REDAYAAVQG NSMKVWRGEG RFIDFLKADP VVSKALSDAE LEELFDYGYH 
TKNVDVIFKR VFGEQG