Gene Caul_5290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5290
Symbol
ID	5897426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	231571
End bp	232713
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	69%
IMG OID	641555393
Product	aminotransferase class V
Protein accession	YP_001676724
Protein GI	167621939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00731204
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0470255
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCA GCAACAGCCC ACTGTCCGGC GGCGATGACC CCCGCACACA GCCTGGCCTG 
GGCCCGCAAG CCTTCGGCGT CGACGGCGCC TGGCTCGACA GCGCCTATTA CCATCCCATG 
AGCCTTGGCG CGGTCGAAGC GGCCACGGGT TATCTGCGCT CGCGCATGGG CGCGGCCGCC 
TCTCCGCCCC GAGAGACCCG CGCCATGCAG ACCCGGGTGC GCGCCAAGTT CGCCGCCCTG 
ATCGGCGCGC AGGCTTCGGA GATCGCCTTC ACGCCCAGCG CCACCGTCGC TGAGAACTTG 
GTCGTCGCCG CCCTACGGCT GGCCGCCGGC TCGCGTGTGG TCACCGATGT GCTCCACTAT 
CATGGCTCTC TTCGGCTCTA CGAAGGGCTG CGGGCGCGTG GCGTCGAGGT CGAGGTGCTG 
GCGGCGCGCG GCGGCCGGAT CGATCCTGGA GAGTTGGCCG CGGCATTGGT GCGCCGGACT 
GATCTTGTGG CGGTTTCGGC GGTCTCGCAG GTCAACGGCT TTGAACATGA TCTGACCGGG 
CTTTGCCGCT TGGCGCACGC CAGCGGCGCA TGGGTCTATG CCGACATCAT CCAGGTGGCC 
GGGGCCAAGC CCTTCGACGT GCGGGCCAGC GGCGTCGATT TCTGCGGGGC CTCAAGCTAC 
AAATGGCTGA TGGGCGACCA GGGTCTGGGG TTTCTCTATG TCCGCGCCGA CCGGTTGGAG 
GCGCTGCACC AGCCCCAATT CGGCTCACGT CAGGCCGACC TTCGCCTCAA CGGCGACAAC 
CCGACGGCGC AACGCTTCGA GGTCGGCACG ATCAACCTGG CCACGGCCGC GGCCTTGGAC 
GTATCGCTGT CGGCCATCCT GAGCCTCACA CCGTCCGTCA TCGCCGAACG GCGGGCCCCG 
CTTCTGGCGC GTCTGCGCGA CACCTTGCCC GGGCTGGGTC TGGACCTCCT GACCCCGCCC 
GGCTCAAACG GGCCGCTCGT GAGTTTCGGG TCCGCCCGCG CGGCGCGGCT CGTCGAACCG 
CTGAACGCGG CCGGCGTTTT CGTCAGCGTC CACCAGGACC GCATTCGGGT CGCCCCGTCG 
GTGTTCAACA CCCACGAGGA CCTGGACCGC CTGTTCGCGG TCGTCGCCCA CACCCTGAGC 
TGA

Protein sequence

MTISNSPLSG GDDPRTQPGL GPQAFGVDGA WLDSAYYHPM SLGAVEAATG YLRSRMGAAA 
SPPRETRAMQ TRVRAKFAAL IGAQASEIAF TPSATVAENL VVAALRLAAG SRVVTDVLHY 
HGSLRLYEGL RARGVEVEVL AARGGRIDPG ELAAALVRRT DLVAVSAVSQ VNGFEHDLTG 
LCRLAHASGA WVYADIIQVA GAKPFDVRAS GVDFCGASSY KWLMGDQGLG FLYVRADRLE 
ALHQPQFGSR QADLRLNGDN PTAQRFEVGT INLATAAALD VSLSAILSLT PSVIAERRAP 
LLARLRDTLP GLGLDLLTPP GSNGPLVSFG SARAARLVEP LNAAGVFVSV HQDRIRVAPS 
VFNTHEDLDR LFAVVAHTLS