Gene Caul_0981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0981
Symbol
ID	5898436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1037379
End bp	1038950
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	66%
IMG OID	641561463
Product	hypothetical protein
Protein accession	YP_001682609
Protein GI	167644946
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.478644
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTCG CGCGGGCGCA GAGGCGCATT TGGAAGGTGC CCGCCATGTC CATCATCATC 
CTCAATGACC CGACCTACGG CGTCGTCCTG TTCGGCGACA CCCAAGACGA GTTGATCGCC 
AGTCAGGTCG GCCTCTCGCA AACGCTGGCC GAGACTTACA CCGTGGACGA GCACGGGGAC 
AGCATCCCCC TCGATTACCA GGTGGGCGAC GCCTCCGGCA TCCGGGGGAA CGCGCTAGGC 
GGTGACGATC ATATCACCAG CTATGGTTCC GCGGTTGGAG ACGCCTTTAC GCTGGCCGAA 
CACGGGCGAG GCGGGATGGA CACCATCTTC GCCCACTCCG GGCACGGGTC GGCGTTTGGC 
GACGCCCTGA CCATGACCGG TCACGCCAGC GGCGGTGACG ATCTGATCAC CATCTTCAAC 
GACTCCTTCG GGGGTTGGGA TGGTTCGATG TTCGGCGACG CCAAGCTGAT GACGGATGAC 
GCCCGGGGCG GCAACGACAC ATTGAAAGGG TTGTCCGACC ACCTCAGCGA CGAGGTCGTG 
CTCTATGGCG ACGCCCTTGA GATGAACGGT CGCGCCCAGG GGGGCGACGA CATTCTCGCC 
GGCGACATGT GGACGTCCAA CTACCAATAC GGAGACGCCC AAACCCTGTC GGAGCAGGCG 
CGGGGCGGCA ATGATCGGCT GTTCGGCGGG GACTATTCAT GGACCGAGCT TAACGGCGAC 
GCCTATCTGC TGACCGACAA CGCGGTGGGC GGCAATGACC TGATCACCGG CGGAAGCGCC 
TACGACGTGT CTGAGGGCGC CAATGATATG CTCGGCGACG GCTACCAGCT CGCGGGCCAC 
GCCATCGCCG GAGACGACGT GCTGATCGGC GGGAGGGGCG ACAGCAACAC CATGTGGGGT 
GATGGAGTTC TGATCGGGCC GGACGTGACC CGCGGCCACA ACAGGTTCGT GATCTCCCCG 
TCCGGCGAGA TCGACACCCT CAAGGACTTC AATCCCGGCC ACGACCAGAT CGTGCTGGCG 
GGGTTCACCT ACACCGCGTT CGCCGACATC GCCGGCGCCA TTCACCCCAC GGACACGGGC 
GTGCAGATCG ATCTTGGTGC TGACGGCCTC GTCATCGTCG AGGGCGTGAC CCAGCTCACC 
GCCGCCGATG TGACGTTCGA CGCCAACGCC CGCAAGGTCG CGGGCGGGTC GCACAATGAC 
GTGCTCACAG CGGCGGGCGG CAACAACGCC TTCCATGGCG GCCTGGGGGA CGACACCTTC 
ATCATCCAGG CGGTGGGCCT GGCCAACTCG GTCGGCGGCT CCACCCAGGG GGTCGGGGCC 
GACAGCGTCA TCTGGGACTT CGCCGGGGCT GGCGGCACGC CCGCCGGCGC GAACGACCTG 
CTCCAGCTCC AGGGCTTTGG CCCGGGCTCC ACCCTGACCT TCCTCCGCTT CGGCGGCTTG 
CGCGCGGGCG GACCCGACCC AACCCTGCAG TACTATTCCG TGCACGACAC CATGGGCGGA 
CCCAACCACG TGCTTTTCGT CCATTCGTTG AACGGCCAGT TGCTGACCTC GGCGGACTAC 
GGCTTCATCT GA

Protein sequence

MAVARAQRRI WKVPAMSIII LNDPTYGVVL FGDTQDELIA SQVGLSQTLA ETYTVDEHGD 
SIPLDYQVGD ASGIRGNALG GDDHITSYGS AVGDAFTLAE HGRGGMDTIF AHSGHGSAFG 
DALTMTGHAS GGDDLITIFN DSFGGWDGSM FGDAKLMTDD ARGGNDTLKG LSDHLSDEVV 
LYGDALEMNG RAQGGDDILA GDMWTSNYQY GDAQTLSEQA RGGNDRLFGG DYSWTELNGD 
AYLLTDNAVG GNDLITGGSA YDVSEGANDM LGDGYQLAGH AIAGDDVLIG GRGDSNTMWG 
DGVLIGPDVT RGHNRFVISP SGEIDTLKDF NPGHDQIVLA GFTYTAFADI AGAIHPTDTG 
VQIDLGADGL VIVEGVTQLT AADVTFDANA RKVAGGSHND VLTAAGGNNA FHGGLGDDTF 
IIQAVGLANS VGGSTQGVGA DSVIWDFAGA GGTPAGANDL LQLQGFGPGS TLTFLRFGGL 
RAGGPDPTLQ YYSVHDTMGG PNHVLFVHSL NGQLLTSADY GFI