Gene Caul_2241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2241
Symbol
ID	5899696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2433455
End bp	2435161
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	68%
IMG OID	641562732
Product	asparagine synthase
Protein accession	YP_001683866
Protein GI	167646203
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0367] Asparagine synthase (glutamine-hydrolyzing)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.67145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTATC TGCTCATGAC GTGGCCTCCA GGGCAGCCTT CCGTCGAAGC AGACGCCCTG 
CATGCCGCCT TCAACGGTCA GGGCGGATGG TCGCTGGTCC TGGAGCGCTT TTGCCTCAGG 
GTCTATGTGC GTGGAGCGGC GGCCCCGGCC GTCACGTTGA CGCCAAAGGG CGGCGTTTTG 
ATCGGCGAGA TGTTCGACCG GGCGGCGACA GAGACCGGCG CCGTCGCCGC CTACGATCTG 
AGCCGCTTGG GTGACGACGA CGGCATGGCC GTGGCGCGGC GGGTCGTGGA CGAGGCTTGG 
GGCCGCTATG TCCTGGTGCT GCCGGTGAAG GAGCGCCGAC CCGTCGTCTT GAGGGAACCG 
CTCGGCGCGT TGGATGCGCT CATCTGGCGC AAGGGCGATG TCTGGTGTGT CGGCGCCGAC 
GTGCCGCCAG GTCTGGAGCC CAAAGACCTT GGGGTAGAGG AAACGCGGCT CACCCATTTG 
ATCGCCGAGC CCGACTTGGC CAGCGCGAGC CTTCCGCTCA CCGGCGTGGC CGCCGTCATG 
CCGGGCACGG CGGTGGACGA AACGGGTCAG GTCCATCGTC TCTGGACACC CGCGCGCTTC 
GCCAGGTCGC CCCGCACCGA CGCCTGGACA GCGGCCGAGC GCATTCCTTT GGTCACGCGG 
GCCTGCATCG CGGCGCTCTC GGCTAACCGC AGCGGCATAT TGTGCGAGAT CTCCGGTGGC 
TTGGACTCGG CCATCGTCGC AACCAGCTTG AAGGCCGAAG GCGCGAAGAT CTCTTCAGGC 
ATCAATTTTC ACTGGCCCCA GGCGGAGGCC GATGAACGGC CCTATGCCCG CGCCGTCGCC 
AAGAGCGTGC GCACGCGCCT GCAAGTCGTC GCCAGCCGCG TCGCGCCGGT CGATCCGGAG 
ACCTTCGACG AGATCGTCGT GGCTAGGCCA AGCTTCAACG CCATCGATCC GGTCTACGAC 
ACGGTGCTCG CGCAGCGTCT GATCCAGGGC GGCGAGGGCG CCCTGTTCAC CGGACAGGGA 
GGAGACGCGG TCTTCTACCA GATGCCGGCG CCGCAGTTGT CGCTCGACCT CCTCGCCCGT 
GGCCCGCGAC GGCGGGGTTT GATGGGGCTG TCACGACGCA CAAATCGGTC GGTCTGGTCC 
CTCCTCAGGA TGGGCCTGCG GGCGCCCGTC CGTGCGACCT TTCCCTATGG CGCGCGCGGG 
GCGGATCGGC CCCCGATGCA TCCCTGGCTT GAGGACGCGC GGGGCGTCGG CGCGGCCAAA 
CGCATCCAGA TCGAGGCGCT GGTCGCCAAC CAGGCCGTTT TCGAAGCCAG CCGCCGCGGC 
GCGGCGGCCC ACCTCGTCCA CCCGCTGCTC AGCCAGCCCC TGGTCGAACT GTGTCTCTCC 
ACGCCAGCGG CCGTGCTCGC CGGCGCGGAG CAGGATCGCG CCTTCGTCCG TTCGGCGTTC 
CGCGCACAGC TTCCTCGTCT CGTCCTGGAT CGGCAGTCAA AGGGCGATTT GTCGGTGTTC 
TTCGCCAAGG GTGTCGCCAG GAGTCTGCCG GGCCTTCGAC CGCGACTGCT GGAAGGGCGG 
CTTGCCGCGC GCGGCCTCAT TGATGTCGAG GCGTTGTCGC AAGCCATGCA GCCCGAGGCG 
ATGATCTGGC GTGACGGTTC GGCGGAAATC CTCTGCCTTG CGGTGCTGGA GTCCTGGTTG 
CGGAGCTGGG AAGCGCGCGG CGCCTAA

Protein sequence

MSYLLMTWPP GQPSVEADAL HAAFNGQGGW SLVLERFCLR VYVRGAAAPA VTLTPKGGVL 
IGEMFDRAAT ETGAVAAYDL SRLGDDDGMA VARRVVDEAW GRYVLVLPVK ERRPVVLREP 
LGALDALIWR KGDVWCVGAD VPPGLEPKDL GVEETRLTHL IAEPDLASAS LPLTGVAAVM 
PGTAVDETGQ VHRLWTPARF ARSPRTDAWT AAERIPLVTR ACIAALSANR SGILCEISGG 
LDSAIVATSL KAEGAKISSG INFHWPQAEA DERPYARAVA KSVRTRLQVV ASRVAPVDPE 
TFDEIVVARP SFNAIDPVYD TVLAQRLIQG GEGALFTGQG GDAVFYQMPA PQLSLDLLAR 
GPRRRGLMGL SRRTNRSVWS LLRMGLRAPV RATFPYGARG ADRPPMHPWL EDARGVGAAK 
RIQIEALVAN QAVFEASRRG AAAHLVHPLL SQPLVELCLS TPAAVLAGAE QDRAFVRSAF 
RAQLPRLVLD RQSKGDLSVF FAKGVARSLP GLRPRLLEGR LAARGLIDVE ALSQAMQPEA 
MIWRDGSAEI LCLAVLESWL RSWEARGA