Gene Caul_4454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4454
Symbol
ID	5901915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4821797
End bp	4822906
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	66%
IMG OID	641564973
Product	ABC transporter periplasmic binding protein, urea carboxylase region
Protein accession	YP_001686072
Protein GI	167648409
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR03427] ABC transporter periplasmic binding protein, urea carboxylase region

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCT GGTTCAACGG TATGCGTATC GCCGCGGCTG TCGCCGCATG CGGGCTGGCG 
CTCAGCGCCT GCGGTCCCAA GACCGAAACC AAGACGGCCG CCGCGCCGGC GCCCGCCGCC 
GTCAAGACCG ACTACAGGAT CGGCTGGACG ATCTATGCCG GCTGGATGCC CTGGGCCTAC 
GCCCAGCAGT CGGGCATCGT GAAGAAATGG GCCGACAAGT ACGGCGTGCA GATCGAGCTG 
GTGCAGATCA ACGACTATGT CGAGTCGCTG AACCAGTTCT CGGCCGGCAA GCTGGACGGC 
GTCACCGCCA CCAACATGGA CGCCCTGACC GTGCCGGCCG CCGCCGGAAA GGACACCACG 
GTCCTGATGA TCGGCGACTA TTCCAACGGC AATGACGGCG TGATCCTCAA GAACGGCGAG 
ACCCTGGCCG ACATCAAGGG CCGGCCGGTC AACCTGGTCG AGCTGTCGGT CTCGCACTAC 
CTGTTGGCCC GCGCGCTGGA AAAGGCCGGG CTGAAGATGG CCGACGTCAA GACGGTCAAC 
ACCTCCGACG CCGACATCGT CGCCGCCTAT GGCGCCGCCG ACACCAAGGC CCTGGTCACC 
TGGAACCCGC AGCTGTCGGA AGTGAAAAAG ATGCCGGGCG CGAGCCTGGT GTTCGACAGC 
TCCAAGATCC CCGGCGAGAT CCTCGACGGC CTGATGGTCA GCACCGACGC GCTGAAGGCC 
AATCCCAACC TCGGCAAGGC CCTGACCGGC ATCTGGTACG AAACCATGGC CCTGACCGTC 
GCCCAGACCC CGGAAGGCAA GGCCGCGCGC GAGGCGATGG CCAAGCTGTC GGGCGCCGAC 
CTGGCCAGCT TCGAGAGCCA GTTGAAGACG ACCTACCTCT ACGCCGACCC CACGGCCGCC 
CTGGCCGCGA CGGTCAGCCC CGACCTAGTC ACGGCCAACG ACCGGGTGCG CAAGTTCAGC 
TTCAGCATGG GCCTGTTCGG CCAAGGCGCG AAGTCGGTGG ACGACATCGG CATCAGCTTC 
CCGGGCGGCA AGACGCTGGG CGACCCGGCC AATGTGAAGC TGCGCTTCGA TCCGACCTAT 
GTGCAGCAGG CGGCGGACGG CAAGCTGTAG

Protein sequence

MKTWFNGMRI AAAVAACGLA LSACGPKTET KTAAAPAPAA VKTDYRIGWT IYAGWMPWAY 
AQQSGIVKKW ADKYGVQIEL VQINDYVESL NQFSAGKLDG VTATNMDALT VPAAAGKDTT 
VLMIGDYSNG NDGVILKNGE TLADIKGRPV NLVELSVSHY LLARALEKAG LKMADVKTVN 
TSDADIVAAY GAADTKALVT WNPQLSEVKK MPGASLVFDS SKIPGEILDG LMVSTDALKA 
NPNLGKALTG IWYETMALTV AQTPEGKAAR EAMAKLSGAD LASFESQLKT TYLYADPTAA 
LAATVSPDLV TANDRVRKFS FSMGLFGQGA KSVDDIGISF PGGKTLGDPA NVKLRFDPTY 
VQQAADGKL