Gene Caul_4549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4549
Symbol
ID	5902010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4923871
End bp	4925172
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	66%
IMG OID	641565068
Product	phosphate ABC transporter, inner membrane subunit PstA
Protein accession	YP_001686167
Protein GI	167648504
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0581] ABC-type phosphate transport system, permease component
TIGRFAM ID	[TIGR00974] phosphate ABC transporter, permease protein PstA

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.429407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACG CCGCCATCAA ACCCGGCGCG CCGGCCGCTC GCCCGGCCCT GTCGGCCCGC 
GAGGCCCTGC TCAAGAAGCG CCACCGCTCC GAGACCTGGT TCCGGGTCCA GGGCATCGCG 
GCGATCGTCA TCGCCATGAT CTTCCTGGTC ATGCTGGTGG GCCGCATCGT CGCCCAAGGC 
TACTCGACCT TCGAGACCCA CACCCTGACC GTGCCGGTCT ATCTGAACCC CGAGCGCATC 
GACACGACCG CGCTGGAAGG GGTCAATTAC GACTACATTG TCGCCGAGGC GATGATGAAG 
AAGCTGGGCG TGCAGGACGA CGACCTGGGC ACGACGTCGG GCAAGATCAT GGACCTGACC 
TCGCGCGACT TCGGCAGCCA ACTGCTGCAG ATGATCAAGA AGGACCGCTC GCTGATCGGC 
AAGACGGTCA ATGTCACCGG CTCGGTCAAG GCCGACGCCG ATCTCTACTA TAAGGGCGAG 
ATCCAGCGAT CGACCGCCGA GGGCGACCGC AAGCTCGACA ACCAGCAACT GGACTGGCTG 
GACAAGCTGA AGAACGAGGG CACGGTGAAG ACCGGCTTCA ACATCAAGTT CTTCACCAAC 
TCCGACTCCA CCGAGCCTGA ACAGGCCGGC GTCTGGGGCG CGGTGATCGG CTCGGCCATG 
ATGCTGATCA TCACCGCGAC GATCGCCATT CCGGTCGGCG TGATGGCCGC GGTCTACCTG 
GAAGAGTTCG CCCCGAAGAA CCGCTGGACC GACGTGATCG AGGTCAACAT CAACAACCTC 
GCCGCCGTGC CTTCGATCGT CTACGGCCTG CTGGGCCTGG CCCTGTTCAT CAACTGGCTG 
CATGTGCCGC GCGGCTCGCC GCTGGTCGGC GGCCTGGTGA TGGCCCTGAT GGCCCTGCCG 
ACCGTGATCA TCGCCACCCG CTCATCGCTG AAGGCCGTGC CGCCCTCGAT CCGCGAAGCC 
GCCCTGGGCG TTGGCGCGTC CAAGGCCCAG ACGGTGTTCC ACCACGTGCT GCCGCTGGCC 
ATGCCCGGCG TGATGACCGG CGCCATCCTG TCGCTGGCCC ACGCCCTGGG CGAAACCGCG 
CCGCTGCTGA TGATCGGCAT GGTCGCCTTC GTGCCTGGCG CCCCGGAGAG CTTCACCAGC 
TCGGCCACGG TGCTGCCGGT CCAGGTGTTC ATCTGGGAAA ACGCCTCGGA GCGCGCCTTC 
CATGAACGCA CCGCAGCGGC CATCATCGTG CTGCTGGTCT TCATGATCGT CATGAACGCC 
GCCGCCGTGA TCCTGCGTCG CCGCTTCGAG CGCCGGTGGT AG

Protein sequence

MTDAAIKPGA PAARPALSAR EALLKKRHRS ETWFRVQGIA AIVIAMIFLV MLVGRIVAQG 
YSTFETHTLT VPVYLNPERI DTTALEGVNY DYIVAEAMMK KLGVQDDDLG TTSGKIMDLT 
SRDFGSQLLQ MIKKDRSLIG KTVNVTGSVK ADADLYYKGE IQRSTAEGDR KLDNQQLDWL 
DKLKNEGTVK TGFNIKFFTN SDSTEPEQAG VWGAVIGSAM MLIITATIAI PVGVMAAVYL 
EEFAPKNRWT DVIEVNINNL AAVPSIVYGL LGLALFINWL HVPRGSPLVG GLVMALMALP 
TVIIATRSSL KAVPPSIREA ALGVGASKAQ TVFHHVLPLA MPGVMTGAIL SLAHALGETA 
PLLMIGMVAF VPGAPESFTS SATVLPVQVF IWENASERAF HERTAAAIIV LLVFMIVMNA 
AAVILRRRFE RRW