Gene Caul_2194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2194
Symbol
ID	5899649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2386414
End bp	2387274
Gene Length	861 bp
Protein Length	286 aa
Translation table	11
GC content	67%
IMG OID	641562686
Product	sulfate ABC transporter, inner membrane subunit CysW
Protein accession	YP_001683820
Protein GI	167646157
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4208] ABC-type sulfate transport system, permease component
TIGRFAM ID	[TIGR00969] sulfate ABC transporter, permease protein [TIGR02140] sulfate ABC transporter, permease protein CysW

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.908554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.306467
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCGC CCCGCGCCTC GCGCGCCCGC CATCCGACCG AGGATCCGGT CTGGGCCAAG 
CTCGTGATCA TCGGCCTGGT CCTGGCCTTC CTCGGCCTGG TCCTGGTCCT GCCGCTGGTG 
GCGGTGTTCG CCGAGGCGCT GCGCAAGGGC TTGCAGCCCG CGCTCGACGC CATCGCCAAT 
CCGGACGCCG TCGCCGCGAT CAAGCTGAGT TTGATCACCG CCGCGATCGC CGTGCCGTTC 
AACGCCGTCT TCGGCCTGTG CGCCGCCTGG GCGATCGCCA AGCACCACTT TCCCGGCAAG 
CCCCTGCTGA TCACGCTGAT CGACCTGCCG TTCTCGGTGT CGCCGGTCGT GGCGGGCCTG 
ATGTACGTGA TGGTCTTTGG CCTGCAAGGC TGGTTCGGCG AGCGCCTGAT CGACCACGAC 
ATCAAGATCA TCTTCGCCGT GCCCGGAATC GTGCTGGCCA CCGTCTTCGT GACCTTCCCG 
TTCATCGCCC GCGAACTGAT CCCGCTGATG CAGGAGCAGG GCGTGGCCGA GGAAGAGGCC 
GCGGTTTCGA TGGGGGCCTC GGGCCTCTAC ACCTTCTGGC GGGTGACCGC GCCCAACGTG 
CGCTGGGGTC TGCTGTACGG CGTACTGTTG TGCAACGCCC GCGCCATGGG CGAATTCGGC 
GCCGTGTCGG TGGTCAGCGG CCATATTCGC GGCCTGACCA ACACCATGCC GCTGCACGTC 
GAGATTCTGT ACAACGAGTA CGACTTCGTC GCCGCCTTCG CGGTCGCCGC CTTGCTGTGC 
CTGCTGGCGA TCGTCACGCT CGTGCTCAAG GGCCTGCTCG AGATCGCCCA ACCCGACGTC 
AAGCGCGGCG GCGGACACTA G

Protein sequence

MSAPRASRAR HPTEDPVWAK LVIIGLVLAF LGLVLVLPLV AVFAEALRKG LQPALDAIAN 
PDAVAAIKLS LITAAIAVPF NAVFGLCAAW AIAKHHFPGK PLLITLIDLP FSVSPVVAGL 
MYVMVFGLQG WFGERLIDHD IKIIFAVPGI VLATVFVTFP FIARELIPLM QEQGVAEEEA 
AVSMGASGLY TFWRVTAPNV RWGLLYGVLL CNARAMGEFG AVSVVSGHIR GLTNTMPLHV 
EILYNEYDFV AAFAVAALLC LLAIVTLVLK GLLEIAQPDV KRGGGH