Gene Caul_2554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2554
Symbol
ID	5900009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2775760
End bp	2776866
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	47%
IMG OID	641563045
Product	hypothetical protein
Protein accession	YP_001684179
Protein GI	167646516
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.118621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAAGG CCGAAATCGA TGAGGCGAAG CGCCTCGTCA CTACCGATAC AGTTCAAATT 
ACGATCGGCG AGATCGCGTC GATGTATGCC TCTGACGAGC TTGATATTAT ACCGGAATTT 
CAAAGATTGT TCCGTTGGTC TATAGAGAAA AAATCTAGTT TTATAGAATC CATCCTGATT 
GGAATTCCTG TCCCCCCCGC GTTTGCCTAC GAAAATGCGG ATGGCACATG GGAGCTTATT 
GACGGCCTTC AAAGAATTTC TACCATTCTT GAATTCATGG GACTCCTGCG CGATCTTGAT 
AATCCCGGAT CATTTAGACA GTCGACCCTT ATGGAAACAA AGTATCTAAA ATCTCTCCGA 
GACGCGAGAT GGTCTCCATT TGATCTTGAC GCTACAAATG TACTTGATAA ATCTCTTCAG 
CTATTTTTCC GACGAGCCAG AATAGACTTT CAAGTTCTAA AGCATCCGAG TGATCCGCGC 
ACGAAATTTG ATCTTTTTCA GCGACTTAAC CGCGGCGGCG CTTACGCCAA TGAGCAGGAA 
GTTAGAAGCT GCTCGATGGT TCTCGCGGAT CGCGAATTTA CAAAGGAAAT CAAAAATTTT 
GCAGATAGCG ATATATTTCG GAAAGTGTTT AAAATTACCC CAGAACAATC TATAAATCAG 
AAAAACGTTG AATACGCTGT TAGGTTGATC GTTCATACAT TCAGAGACTT TACCAGCGGC 
ACAGATGTAC AAGAGTTCCT AGACAAATCT ATAATTAGCA TCATGACGGA AGAAAATCAG 
GCCGCCGTGA TGGAGACAAT TCGCTGGACG GTGGAGACCC TGAGTCGAGC GGCTGGGGAT 
GGAGTATTGG TGCCGCCAGC CGACGCTCCT GAAGAAATTG CCAATCGTTT TTCTCTCCGC 
GCGCTAGAGG CGATAGCATC TGGCCTGGCA AGAAACCGGG AGGCTGTATC AAGGCTTCCC 
GATCAAGATG CATTCGTTCG GGAGAGAATC TCTGGATTTT GGCAGCAGGA ATCAGTGCTC 
CAAATGAGCG CCTCCGGCTT GCGTGGAACC ACTCGTATTC AGCGCACTGT TCTTTTTGGA 
GAATCTTGGT TTAAACCCGA TGCCTGA

Protein sequence

MLKAEIDEAK RLVTTDTVQI TIGEIASMYA SDELDIIPEF QRLFRWSIEK KSSFIESILI 
GIPVPPAFAY ENADGTWELI DGLQRISTIL EFMGLLRDLD NPGSFRQSTL METKYLKSLR 
DARWSPFDLD ATNVLDKSLQ LFFRRARIDF QVLKHPSDPR TKFDLFQRLN RGGAYANEQE 
VRSCSMVLAD REFTKEIKNF ADSDIFRKVF KITPEQSINQ KNVEYAVRLI VHTFRDFTSG 
TDVQEFLDKS IISIMTEENQ AAVMETIRWT VETLSRAAGD GVLVPPADAP EEIANRFSLR 
ALEAIASGLA RNREAVSRLP DQDAFVRERI SGFWQQESVL QMSASGLRGT TRIQRTVLFG 
ESWFKPDA