Gene Caul_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1999
Symbol
ID	5899454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2145364
End bp	2146776
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	63%
IMG OID	641562488
Product	UBA/THIF-type NAD/FAD binding protein
Protein accession	YP_001683625
Protein GI	167645962
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCTA CGCTCCGAAT GACCGGGCGC CATGCTCGAC GCCTTCATGC TCACCTCTTC 
CCGGGGGATG GCAAGGAAGC CGTGGCCATT GCTCTGTGCG GCCGGCGCAG GGGAGCCTAC 
GAGCGCCTGC TCGTGCACAA GCTGGTTCTT ATTCCCCACG GGGACTGCGA CCTGCGCACG 
CCGCTCACTG TGGCTTGGTC GACCGACTTG ATCGTGCCGG CCCTCGAAGA AGCCGAGCGC 
CGCGGGTGGA GTGTGGTGAA GTTCCATAGT CACCCTGGTG GCTACAACAT GTTCTCGGAT 
CAAGACGACC TCTCCGATGG CCTGCTTTTT CCGGCTATTC ATGGATGGGT CGAGCACGAG 
GTGGCCCACG CCAGCGTCGT AATGCTGCCT GACGGAGCGA TGTTTGGCCG GACGGTCGAC 
GCTCAGGGCG TCTTCTCGCC CCTGGAAGCT ATCGTCGTGG CCGGCGAGCG GATCGAGATT 
TGGCGCCATA GTGAAGTAAC GGGCGAGGGT GTCATCGCGC CCCTGCCGGA TTTCGCCAAG 
CGTCATGCCC AAGCGTTCGG CGTGCGCACC ACCCGGCGGC TCAGCCACCT CTCGGTCGCC 
GTGGTCGGCT GCTCGGGCAC AGGCAGCATC GTGATCGAAC AGCTCTACCG GCTGGGTGTT 
GGGCGATTGG TGATCGTCGA CCCCGACGTG GTCAAGGACA TCAACCTCAA TCGGATTTTG 
AACACCACGT CTGCCGACGC GGCGGCTGCG CGCGCCAAGG TCGAGGTGCT GCATGACACC 
ATCGTGCGTA CCGGGCTCGG GACCGACGTT CTGCCGATCG CCAAGAGCCT GTTCGACCCC 
GAGGCGATCG CCGCCGTGGC CGACTGCGAT CTGGTCTTTG GATGTGTGGA TTCCGCCGAG 
GCGCGGTTCC TGATCAATCG TATCACCGCA TTTTACGTGA TGCCGTACTT CGACGTCGGC 
GTTGCACTCG ACGCCGACCA GGCCGGACGG ATCACCCAGG TTTGCGGCTA TCTGCATTAC 
GTACAGCCTG ACCAATCGAG CATGGTCAGC CGCGGTGCAA TTTCGATGGA GGAGGTGCGG 
GCCGAGGGCG AGAAGCGCCG CAATCCCGAG CACTACGCAA ATCTGCGGCA GGCCGGGTAC 
ATCCAGAATG TCGACGAAGA CCGGCCGGCG GTCATCAGCG TCAACACCGT GTTCTCAGGT 
CTGATCGTCA ACGAGTTTTT AGCGCGTCTT CACGATTTCC GGGACGATCC GGGCGACGCC 
TACGCCACGA TTGGCTTCAG CTTGAGCCAG ATGATGTTCT ATCCCGAGGC CGAAAGCGGC 
ATGCCGTGCC GCGTGTTCTC GCCTCACGTT GGGCGGGGCG ATACGCGCTT GCTGCTCGAC 
ATGCCTGAGT TCAGCCTGGG GCAGCGCTCG TGA

Protein sequence

MAATLRMTGR HARRLHAHLF PGDGKEAVAI ALCGRRRGAY ERLLVHKLVL IPHGDCDLRT 
PLTVAWSTDL IVPALEEAER RGWSVVKFHS HPGGYNMFSD QDDLSDGLLF PAIHGWVEHE 
VAHASVVMLP DGAMFGRTVD AQGVFSPLEA IVVAGERIEI WRHSEVTGEG VIAPLPDFAK 
RHAQAFGVRT TRRLSHLSVA VVGCSGTGSI VIEQLYRLGV GRLVIVDPDV VKDINLNRIL 
NTTSADAAAA RAKVEVLHDT IVRTGLGTDV LPIAKSLFDP EAIAAVADCD LVFGCVDSAE 
ARFLINRITA FYVMPYFDVG VALDADQAGR ITQVCGYLHY VQPDQSSMVS RGAISMEEVR 
AEGEKRRNPE HYANLRQAGY IQNVDEDRPA VISVNTVFSG LIVNEFLARL HDFRDDPGDA 
YATIGFSLSQ MMFYPEAESG MPCRVFSPHV GRGDTRLLLD MPEFSLGQRS