Gene Caul_4661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4661
Symbol
ID	5902123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5037339
End bp	5039189
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	65%
IMG OID	641565180
Product	ribonucleotide-diphosphate reductase subunit alpha
Protein accession	YP_001686279
Protein GI	167648616
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0209] Ribonucleotide reductase, alpha subunit
TIGRFAM ID	[TIGR02506] ribonucleoside-diphosphate reductase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.590827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTC TCCCTCAGGC CCGCACCGGC GGCATGAAGG TTGAGCGTCC GAAACTGGCG 
CTGGTGCGCA AGGTCGAGGT CGACCGTTCG CGCGACGCCC TGCTGACCGA TTTTGGCAAG 
ACCACGCTGG AAGACCGCTA TCTGCTCCCG GGCGAGTCGT ACCAGGACAT GTTCGCCCGC 
GTGTCGACGG CCTTCGCCGA CGACGCCGAC CATGCCCAGC GCGTCTACGA CTACATGAGC 
AAGCTGTGGT TCATGCCGTC GACCCCGGTG CTCAGCAACG GCGGCGCCGA ACGCGGCCTG 
CCGATCAGCT GCTTCCTCAA TGCGGTCAGC GACAGCCTGG ACGGCATCCT GGGCGTCTGG 
AACGAGAACG TCTGGCTGGC GGCCAACGGC GGCGGCATCG GCACCTACTG GGGGGGCGTG 
CGGTCGATCG GCGAGAAGGT CAAGGGTCAG GGCCAGACCA GCGGCATCAT TCCCTTCATC 
CGCGTGATGG ACAGCCTGAC CCTGGCGATC AGCCAAGGGT CGCTGCGCCG CGGCTCGGCG 
GCCGTCTATC TCGACATCTT CCATCCGGAG ATCGAAGAGT TCCTCGAGAT CCGCAAAGCC 
TCGGGCGACT TCAACCGCAA GTCCCTGAAC CTGCACCACG GCATCTCGAT CACCGACGAG 
TTCATGCACG CGGTGCGTGA CGGCCACAAG TTCGGCCTGC GCTCGCCCAA GACGGGCGAG 
GTCCTGCGCG AAGTTGACGC CCGCGCCCTG TGGCAGAAAG TTCTGGAGCT GCGGCTGCAG 
ACCGGCGAGC CCTACCTGAT CTTCTCCGAC ACCGTGAACC GCGCCATGCC CAAGCACCAG 
CAAGAGCTGG GCCTGAAGGT TCGCCAGTCC AACCTGTGCA GTGAGATCAT GCTGCACACC 
GGCGTCGACC ACCTGGGCAA CGACCGCACG GCGGTCTGCT GCCTGTCGTC GGTGAACGCC 
GAGACCTTCC TGGAGTGGCG CGACCATCCG ATGTTCATCG AGGACATCAT GCGCTTCCTC 
GACAACGTCC TGCAGGACTT CATCGATCGG GCGCCCGACG CGGCCGCCAC GGCCGCCTAC 
GCCGCCATGC GCGAGCGTTC CGTGGGCCTG GGCCTGATGG GCTTCCACAG CTTCCTGCAG 
AGCCAGAACG TGCCGTTCGA GAGCGCCCTG GCCAAGAGCT GGAACATGCG GATGTTCAAG 
CACCTGCGCC GCGAAGCCGA CAAGGCGTCG ATCACCATCG GCGAAGAGAA GGGGCCGTGC 
CCGGACGCCG CCGACCGCGG CTCTATGGAG CGCTTCTCGC ACAAGCTGGC CATCGCCCCG 
ACCGCGTCGA TCTCGATCAT CTGCGGCGGC ACGTCGGCGG GCATCGAGCC GATCCCTGCC 
AACATCTACA CCCACAAGAC CCTGTCGGGA TCGTTCGCGG TGAAGAACCC CTACCTGGAG 
AAAGTGCTCG AGGAGAAGGG TCACAACACC GACGCCGTCT GGGGTTCGAT CCTCGAGAAC 
GAGGGCTCGG TCCAGCACCT GGACTTCCTC AGCCAGGACG ACAAGGACGT CTACAAGACC 
GCCTTCGAGC TGGACCAGCG CTGGGTGGTC GAGCTGGCCG CCGATCGCAC GCCGGAAGTC 
TGCCAGAGCC AGTCGGTGAA CATCTTCCTG CCCGGCGACG TCGACAAGTG GGACCTGCAC 
ATGCTGCACT GGCAGGCCTG GGAGCGCGGC GTCAAATCGC TGTACTACCT GCGCTCCAAG 
TCGGTGCAGC GGGCGTCCTA CGCCGGTTCA GACGTCGCCT TGGCGGGTCC CGCCAACGGC 
TTCGACGCTC CGTCCAAAAC TGACTACGAG GAATGCCTGG CCTGTCAGTA G

Protein sequence

MTALPQARTG GMKVERPKLA LVRKVEVDRS RDALLTDFGK TTLEDRYLLP GESYQDMFAR 
VSTAFADDAD HAQRVYDYMS KLWFMPSTPV LSNGGAERGL PISCFLNAVS DSLDGILGVW 
NENVWLAANG GGIGTYWGGV RSIGEKVKGQ GQTSGIIPFI RVMDSLTLAI SQGSLRRGSA 
AVYLDIFHPE IEEFLEIRKA SGDFNRKSLN LHHGISITDE FMHAVRDGHK FGLRSPKTGE 
VLREVDARAL WQKVLELRLQ TGEPYLIFSD TVNRAMPKHQ QELGLKVRQS NLCSEIMLHT 
GVDHLGNDRT AVCCLSSVNA ETFLEWRDHP MFIEDIMRFL DNVLQDFIDR APDAAATAAY 
AAMRERSVGL GLMGFHSFLQ SQNVPFESAL AKSWNMRMFK HLRREADKAS ITIGEEKGPC 
PDAADRGSME RFSHKLAIAP TASISIICGG TSAGIEPIPA NIYTHKTLSG SFAVKNPYLE 
KVLEEKGHNT DAVWGSILEN EGSVQHLDFL SQDDKDVYKT AFELDQRWVV ELAADRTPEV 
CQSQSVNIFL PGDVDKWDLH MLHWQAWERG VKSLYYLRSK SVQRASYAGS DVALAGPANG 
FDAPSKTDYE ECLACQ