Gene Caul_5423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5423
Symbol
ID	5897197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	-
Start bp	135505
End bp	136605
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	66%
IMG OID	641550711
Product	putative transposase
Protein accession	YP_001672197
Protein GI	167621689
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.365485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGTCGTG CGAGTCTGCG GATGCGTACT GGCGTCACCG TCCACCTGAG CCCGACCGAT 
CGCAAGCGCC TGCGGGTGAT CGTCGATGAC GGCAACAGCC CCCAGAAGCA TGTCTGGCGC 
GCCAGGATCG TGCTGTGCAC GGCCGACGGG CTTGGCACGG CGGCGATCAT GCGCGCGGCA 
GGGGTCAGCA AGACCGCCGT CTGGCGCTGG CAGGAACGCT TCATGGATGA AGGCGTCGAT 
GGCCTGCTGC GCGACAAGAC CCGCCCCGCG CGGGTTCAGA AGCTGGCCGA CGAGGTCGCC 
GAGCGTATCG TCGCCCTGAC CCTGGGCGAA CCGCCCGGCG AGACCACCCA CTGGACCGGC 
CGGGTGATGG CGGGGGTCGC CGGCGTCAGC CTGACCTCGG TGCAGCGTAT CTGGAAGGCC 
CATGGCCTGG CCCCGCATCG CATCCGCACC TTCAAGCTCT CCAATGATCC CAGGTTCGCC 
GCCAAGGTCC GCGACATCGT CGGCCTGTAT GTCGATCCCC CCGCCCACGC CGTGGTGCTC 
AGCGTCGATG AGAAGTCGCA GATTCAGGCG CTGGACCGCA CCCAGCCGGG GCTGCCGCTG 
AAGAAGGGGC GGGCTGGAAC CATGACCCAT GATTACAAGC GACACGGCAC GACCACCCTG 
TTCGCCGCCT TCGACGTGCT GGAAGGCAAG GTCATCGGCC GCTGCGTGCA GCGCCACCGG 
CATCAGGAGT TCATCCACTT TCTGAACGCC GTCGAGCGCG AGGTCCCGGC CGGAAAGACC 
GTCCACGCCA TCCTCGACAA CTACGCCACC CACAAACACC CCAAGGTGAT CGCATGGCTG 
GGCCGACATC CGCGCTGGAC GTTCCACTTC ACGCCCACCT CGGCCAGCTG GATCAACGCC 
GTCGAGGGCT TCTTCGCCGT CCTCACCAAG CGCCGCCTCA AGCGCGGCGT CTTCAAGGGC 
GTCGTCGATC TGCAGGCAGC CATCAACCGC TTCGTCGCCG AGTACAATCA GCATCCAAAG 
CCCTTCGTCT GGACCGCCGA TCCAGACAAA ATCATCGCCG CAGCGAACCG TGGGCACCAA 
ACGTTGGAAT CAATCCACTA G

Protein sequence

MGRASLRMRT GVTVHLSPTD RKRLRVIVDD GNSPQKHVWR ARIVLCTADG LGTAAIMRAA 
GVSKTAVWRW QERFMDEGVD GLLRDKTRPA RVQKLADEVA ERIVALTLGE PPGETTHWTG 
RVMAGVAGVS LTSVQRIWKA HGLAPHRIRT FKLSNDPRFA AKVRDIVGLY VDPPAHAVVL 
SVDEKSQIQA LDRTQPGLPL KKGRAGTMTH DYKRHGTTTL FAAFDVLEGK VIGRCVQRHR 
HQEFIHFLNA VEREVPAGKT VHAILDNYAT HKHPKVIAWL GRHPRWTFHF TPTSASWINA 
VEGFFAVLTK RRLKRGVFKG VVDLQAAINR FVAEYNQHPK PFVWTADPDK IIAAANRGHQ 
TLESIH