Gene Caul_4585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4585
Symbol
ID	5902047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4959045
End bp	4960466
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	72%
IMG OID	641565104
Product	leucyl aminopeptidase
Protein accession	YP_001686203
Protein GI	167648540
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAAC CGATCATCGC CTCCTCGTCC CGCTCCGCGC AGGATGGCGC GGCGACACCC 
ATCCACTGCC TGTACGAGGC TGAACTGGCC GCCTTCCTCG AGGCGCGGCC CAGCTTCGTG 
AAGGGCTTCG TGGCGCTGGA GGACTTCAAG GCCAAGGCCG GCCAGGTGCT GGTATTGCCG 
ACGCCGCAAG GGGCCGTGGA CCGGGTGTTG CTGGGATTGG GGGCCAAGGG CAAGGCCGAC 
GCCATGCTGT TTCGCGCCCT GCCCGGTCGC CTGCCGGCCG GCGACTACCG CCTGGCGGCG 
ATCCCCGACG GGCTGGACGC CGGCCAGATC GCCTTGGCCT TCGCGCTGGG CGGCTACAGG 
TTCGACCGCT ATCGCCCGAA GGCCGGTGAA GGGCCGCGAC GACTGGTCGC GGACGAAGGC 
GTCGATCTGG ACGAGGTCCG TAGCGTCGCC CACGCCTGCG CCCTGGCCCG CGACATGATC 
AACACCCCGG CCAACGACAT GGGGCCGCTG CAGATCGAGA CCATCGCCCG CGAGATCGCC 
GAGCGCCATG GCGCGACCCT GAGCGTGGTC ACGGGCGACG ATCTGCTGGA GCAGAACTAC 
CCCGCCGTCC ACGCGGTCGG CCGCGCCGCT GTCCCGGCCC GCGGCCCCCG CATGCTGGAG 
ATCACCTGGG GCGACGCCTC GCGTCCGCGC GTGGCGCTGA TCGGCAAGGG CGTGGTGTTC 
GACACCGGCG GTCTCGACAT CAAGCCGTCG TCGGGCATGC GGTTGATGAA GAAGGACATG 
GGCGGCGCCG CCCACGCCCT GGCCCTGGGC CGGATGGTCA TGGCCGCCGG CCTGCCCGTA 
GCGCTGAGCG TGCTGGTGCC CGTGGCCGAG AACGCCATCG CCGGCGACGC CATGCGGCCC 
GGCGACGTGC TGGCCACCCG CGCCGGCCTG ACGGTGGAGG TCGGCAACAC CGACGCCGAG 
GGCCGGCTGA TCCTGGCCGA CGCCCTGGCG CGCGCCGCCG AATTGGAACC GGTCCTGACC 
ATCGACCTAG CCACCCTGAC CGGCGCGGCG CGCGTGGCGC TGGGGCCGCA GGTGATCCCG 
TTCTACACCC CCGACGACGA CCTGGCCCTG GAGATCGAGG AGGGCGCGCG CGAGGCCGTC 
GACCCGGTCT GGCGCATGCC GCTGTGGGAC GGCTATCGCG AGGCGATCGA GGGCGACATC 
GCCGACCTGA AGAACGATCC CGACGCCTGG GCCCAGGCCG GCTCGATGAC GGCGGCCCTG 
TTTCTGCAAC GCTTCGCCCC GACCACGGGG GCCTGGGTGC ATTTCGACAT CTTCGCCTGG 
AATCCCAAGC AGCGCCCGGG CTTCGCCTCG GGCGGCGAGG CCCAGGTGAT CCGCGGGCTC 
TACGGCATGC TCAAGTCGCG GTTCCCGAAG GTTCAAGCAT GA

Protein sequence

MSEPIIASSS RSAQDGAATP IHCLYEAELA AFLEARPSFV KGFVALEDFK AKAGQVLVLP 
TPQGAVDRVL LGLGAKGKAD AMLFRALPGR LPAGDYRLAA IPDGLDAGQI ALAFALGGYR 
FDRYRPKAGE GPRRLVADEG VDLDEVRSVA HACALARDMI NTPANDMGPL QIETIAREIA 
ERHGATLSVV TGDDLLEQNY PAVHAVGRAA VPARGPRMLE ITWGDASRPR VALIGKGVVF 
DTGGLDIKPS SGMRLMKKDM GGAAHALALG RMVMAAGLPV ALSVLVPVAE NAIAGDAMRP 
GDVLATRAGL TVEVGNTDAE GRLILADALA RAAELEPVLT IDLATLTGAA RVALGPQVIP 
FYTPDDDLAL EIEEGAREAV DPVWRMPLWD GYREAIEGDI ADLKNDPDAW AQAGSMTAAL 
FLQRFAPTTG AWVHFDIFAW NPKQRPGFAS GGEAQVIRGL YGMLKSRFPK VQA