Gene Caul_0397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0397
Symbol
ID	5897671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	436316
End bp	437443
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	49%
IMG OID	641560883
Product	hypothetical protein
Protein accession	YP_001682032
Protein GI	167644369
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000747895
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACG AACTTGAAGA TCATGCGGGG ACTGCGCCTG CCACCATCGA AGAGCAGGAG 
GAGCAGGAGG CCACGACTGA CGATTCCAAC GAGACGCCAC CGTCCGATAT CGTCGCCTAT 
AACGAGCTAC GTTCGTGTGC CGACGTATTC CGCATGCATG CCGAAGGCGT TCTTGACATT 
CAGCCGGAGT TTCAAAGGGA GTTTGTCTGG AAGGGTATCG CGCAAACTCG CTTTATCGAT 
TCCCTCGTCA AACAACTCCC AATACCTTCG ATGTGCTTTG CTTACGACTA CAAGCAAAAT 
AGATGGATAG TCATTGATGG CCTTCAACGC ATATCAACAA TTATAAGGTT TCTTGACGGC 
GATAAGCGCT GGAGGCTTTC ATCTCTGCCC GATATTGATC AGCACCTTTC TGGAGCTAGC 
GTTGCTGACA TTAAAAGTGG CAAGAAACCC GAACTGAAAA ACTTCTACGC TCGCGTCCAA 
AACCAGACTC TGCCTGTGAA TGTTCTTCGG TGTGACTTCA AGAAGAAGCG GCACAACGAG 
TATCTATTCA CAATTTTTCA TCGCCTGAAT TCGGGCGGGT CAAAGCTAAA CAATCAAGAA 
ATTAGAAATT GTATATACTC CGGCCCCTTC AATGACCTCC TCCGAAGCCT CGATAAGCTT 
CCGGAGTGGA GAACCATCAA TCATATGAAA GATGACGGCG ATCAGAGATT CATAAAGCAA 
GAATGGATTC TCCGACTGTT TGCATTCTTG GAAGATGGAG CAAAATACAA GGGCTCCGTT 
TCAAAGTTTC TGAATGACTT CATGTTTGAG CACAGAGATG ATCCAGCGAA AGCGCTGGGC 
GCTCGGCGCG ACCTGTTTGA ACGTGTCGTG AAGGTGATGG GTCACAAGAT ATTCGATGAT 
AAGCAACCTG ACCGCATGCC TGGCACGGTG CTTGAAGCCA TTATGGTTGG GATTGCGCGC 
AATCTAGCCA AGTGCGAAGC CGCCAACGCC GATGATCTAA AAAAGCAATT TCGGACGATG 
CTCGATGACG AGAGTATTTC GGACGTCTCG CTCGCCGAAG GACTTTCCAA ACCGGATAAA 
GTAACTGCTC GCTTTCAGGC CGCCACCAAA ATTTTCGCGG GCGGATAA

Protein sequence

MADELEDHAG TAPATIEEQE EQEATTDDSN ETPPSDIVAY NELRSCADVF RMHAEGVLDI 
QPEFQREFVW KGIAQTRFID SLVKQLPIPS MCFAYDYKQN RWIVIDGLQR ISTIIRFLDG 
DKRWRLSSLP DIDQHLSGAS VADIKSGKKP ELKNFYARVQ NQTLPVNVLR CDFKKKRHNE 
YLFTIFHRLN SGGSKLNNQE IRNCIYSGPF NDLLRSLDKL PEWRTINHMK DDGDQRFIKQ 
EWILRLFAFL EDGAKYKGSV SKFLNDFMFE HRDDPAKALG ARRDLFERVV KVMGHKIFDD 
KQPDRMPGTV LEAIMVGIAR NLAKCEAANA DDLKKQFRTM LDDESISDVS LAEGLSKPDK 
VTARFQAATK IFAGG