Gene Caul_3180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3180
Symbol
ID	5900635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3443909
End bp	3444910
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	70%
IMG OID	641563684
Product	D-cysteine desulfhydrase
Protein accession	YP_001684805
Protein GI	167647142
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2515] 1-aminocyclopropane-1-carboxylate deaminase
TIGRFAM ID	[TIGR01275] pyridoxal phosphate-dependent enzymes, D-cysteine desulfhydrase family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.526016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCTGG CCCGTTTCCC CCGCGCCCGT TTCGCCCACC TGCCCACGCC CCTGGAGCCC 
CTGCCCCGCC TGGGCGCGGA GCTCGGGATC GACCTGTGGG TCAAGCGCGA CGACTGCACC 
GGCCTGGCCG GCGGCGGCAA CAAAACCCGC AAGCTGGAGT TCCTGCTGGG CGAGGCGCTC 
GCGCAAGGCG CCGACACCCT GGTGACGCAG GGCGCGGTGC AGTCCAACCA CGTGCGCCAG 
ACCATCGCCG CCGGGGTCCG GTTCGGCCTG AAGAGCGAGA TCATCCTGGA GGAGCGCACA 
GGCTCCAAGG CCAGCGACTA TACCGGCAAC GGCAATGTGC TGCTCGACCG GCTGATGGGC 
GCCTCGATCC GCTTTGTGCC CGGTGGGACC GACATGGTCG AGGAGCTGGA GATTTCAGCG 
GCGAGGGTGC GCCAGCGCGG CGGCAAGCCC TATGTCATCC CCGGCGGCGG CTCCAACACG 
GTCGGGGCGC TGGGCTATGT CGATTGCGCC CGCGAACTGG TGGTGCAGGC CGACGCCATG 
GATCTGAAGA TCGACCGTCT GGTCACCGCC ACCGGCAGCG CCGGCACCCA CGCCGGCCTG 
GTCGCGGGCT TCGCGGCGCT CAGCGTCGAC ATCCCGATCC TGGGCTTTGG CGTGCGCGCC 
CCTAAGGCCA GGCAGGAGGA AAACGTCTTC AACCTGGCGG TCGCCACGGC CGAGACCATC 
GGCGCCGGCG GACGGGTGAC GCGGGACAGG GTGATCGCCG ACTGCGACTA TGTCGGCGCG 
GGCTACGGCC TGGTCGACCA GGGGGTGATC GACGCCCTGA CCCTGGCGGC TCGCACCGAG 
GGCCTGCTGC TGGATCCGGT CTACTCCGGC AAGGCGATGA AGGGCCTCAT CGACCAGGCC 
CGCAAGGGCG CGTTCAAGGG CGAGCGGGTG GTGTTCCTGC ACACCGGCGG GGCGCAGGGG 
TTGTTTGGGT ATCAAAGCGA ACTGGAGGCG GCCCTTGTCT AA

Protein sequence

MHLARFPRAR FAHLPTPLEP LPRLGAELGI DLWVKRDDCT GLAGGGNKTR KLEFLLGEAL 
AQGADTLVTQ GAVQSNHVRQ TIAAGVRFGL KSEIILEERT GSKASDYTGN GNVLLDRLMG 
ASIRFVPGGT DMVEELEISA ARVRQRGGKP YVIPGGGSNT VGALGYVDCA RELVVQADAM 
DLKIDRLVTA TGSAGTHAGL VAGFAALSVD IPILGFGVRA PKARQEENVF NLAVATAETI 
GAGGRVTRDR VIADCDYVGA GYGLVDQGVI DALTLAARTE GLLLDPVYSG KAMKGLIDQA 
RKGAFKGERV VFLHTGGAQG LFGYQSELEA ALV