Gene Caul_2195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2195
Symbol
ID	5899650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2387293
End bp	2388312
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	68%
IMG OID	641562687
Product	sulfate ABC transporter, ATPase subunit
Protein accession	YP_001683821
Protein GI	167646158
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.643313
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.295178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCT CCATCCGTTC CGTCGAAAAG AAGTTCGGGC GCTATCCGGC GCTCAACAGC 
GTCGATCTGG AGATCGCCGA CGGCGAACTC GTGGCGCTGC TGGGGCCGTC CGGCTCGGGC 
AAGACCACTC TGCTGCGAAC GATCGCCGGC CTGGAGTTCC CGGACAAGGG CCAGGTGCTG 
TTCGAGGGCG AGGACGTGAC GTTCGCCTCG GCGGCGGCGC GGCGGGTGGG CTTCGTGTTC 
CAGCAGTATG CGCTGTTCAA GCACATGACC GTGGCCAAGA ACATCGCGTT CGGCCTCGAC 
GTCCGCAAGG GCAAGGACAA GCCCGACAAG GCCGAGATCG CCCGCCGCGT CGAAGAGCTT 
CTGAAGCTGG TCGAGCTGGA CGGCCTGGGC AAGCGCTACC CCTCGCAACT GTCGGGCGGC 
CAGCGGCAGC GCGTGGCCCT GTCGCGCGCC CTGGCGGTGC AACCCAGCGT GCTGTTGCTC 
GACGAGCCGT TCGGCGCCCT GGACGCAACG GTCCGCAAGT CGCTGCGCAA GGAGCTGCGC 
CGGGTGCATG ACGCCACCGG CGTGACCACC ATCTTCGTCA CCCACGACCA GGAAGAAGCG 
CTGGAACTGG CCGATCGCGT GGCCATCCTC AACGCCGGCC GTATCGAGCA GATCGGCACG 
CCGCACGAGG TGCACGACAA TCCGGCCACG CCGTTCGTCT GCGGCTTCGT CGGCGAAGCC 
AACCGGTTCG AGGGAACGGT GTCGGGCGGA CGGTTCACGG CCGGGCCGGT GACGCTGCCG 
GCGCCGCAGG CCGCCAACGG CGCGGCCGTG GCTTTCGTGC GGCCCCACGA CGTAGTGTTG 
GACGCGGCGG GCTTCCCGGC CAAGGTTGAG CGGGTGGTGA TCCAGGGTCC ACTGGCCAAC 
ATTGACGCCT CGCTGCCTGA CGGTCGCCGC ATCGAGATTT GCGCGGCCCG CGACGAGGCC 
GCCAACTTCT CGGGTGAGGT CAGGCTTTCG GCCCGACGGA CGCACGTCTT CGCGGTTTAG

Protein sequence

MTISIRSVEK KFGRYPALNS VDLEIADGEL VALLGPSGSG KTTLLRTIAG LEFPDKGQVL 
FEGEDVTFAS AAARRVGFVF QQYALFKHMT VAKNIAFGLD VRKGKDKPDK AEIARRVEEL 
LKLVELDGLG KRYPSQLSGG QRQRVALSRA LAVQPSVLLL DEPFGALDAT VRKSLRKELR 
RVHDATGVTT IFVTHDQEEA LELADRVAIL NAGRIEQIGT PHEVHDNPAT PFVCGFVGEA 
NRFEGTVSGG RFTAGPVTLP APQAANGAAV AFVRPHDVVL DAAGFPAKVE RVVIQGPLAN 
IDASLPDGRR IEICAARDEA ANFSGEVRLS ARRTHVFAV