Gene Caul_3720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3720
Symbol
ID	5901176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4018260
End bp	4019741
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	69%
IMG OID	641564231
Product	xanthine dehydrogenase, small subunit
Protein accession	YP_001685345
Protein GI	167647682
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG4630] Xanthine dehydrogenase, iron-sulfur cluster and FAD-binding subunit A
TIGRFAM ID	[TIGR02963] xanthine dehydrogenase, small subunit

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCAG GACAACAGCG CGGGGTACGT TTCCTGCTGA ACGGCGAGCC GGTCGAGGCC 
GAGGGCGTCG ATCCCACCCG CACGCTGCTG GAGTATCTAC GCGGCGACCT GCGGCGCACC 
GGGACCAAGG AAGGCTGCGC CGAGGGCGAC TGCGGGTCGT GCACGGTGCT GGTCGGCGAA 
CTGGACGGCG AGGCGCCAAA TCCGAAGGTC GCCTGGCGCG CCGTGAACAG CTGCATCCAG 
TTCGTGCCGA TGCTGGACGG CAAGGCGGTG ATCAGCGTTG AGGGTCTAGC CCCAAAAAAT 
GAAAGGGGAG ACACGCCGCA TCCGGTGCAG GCGGCGATGG TCGAGCACCA TGGCTCGCAA 
TGCGGCTTCT GCACGCCGGG GTTCATCATG TCGCTATACG GCCGGGCCGT CGCGGCCAAG 
GGAACCGACG CGCCGATCGA CGAGGTGCTA GCCGGTAACC TGTGCCGCTG CACTGGCTAT 
GGCCCGATCA TCGCGGCGGC CGAGGCGATC CCCGGCGAAG CGGCGCCGGA TGTGGCCGAC 
AAGCTGGCGG CCTTGCGTCG CGATGCGGCG TTGAGCCTCG ATTACGCGGA CCCAATCGCC 
GGCGTCACCC GTCGCTGGTT CGCGCCACGG AGCGCCGATG CATTGGCCGA GACCTACGCC 
GCGCACCCCG ACGCGGTCGT CGTGGCGGGC GCCACCGATG TTGGCCTGTG GGTCACCAAG 
TTACGCAAGC CGCTCGAGAC CCTGATCGAC ATCGGCCAGG TGGCCGAGCT GAAGCGGATC 
GAGCGCGCCA ACGGCGGCGT GCGGATTGGC GCCGGCGTTC GCTATGTCGA TGCGCTGGAA 
ACGCTGAGCG GGCTCTATCC GGATCTCGGG GCGATGATGC GGCGGCTGGG TTCGACCCAG 
GTGCGCAACA GCGGCACGAT TGGCGGCAAC ATCGCCAACG GGTCGCCGAT CGGCGACATG 
CCGCCGGCCC TGATCGCGGC GGGCGCGACC CTGATCCTGC GCCACTGGAA CGAGCGGCGG 
GTCTTGCCGC TGGAGGATTT CTTCATCGCC TATGGCCAGC AGGACCGTCG TCCGGGCGAG 
TTCGTCGAGG CGGTGCTGGT TCCCGATCCG GCGCCGGGCG CGCTGTTCAA GGTCTTCAAG 
CTGTCCAAGC GTTTCGACCA GGACATCTCG GCGGTGTGCG GGGCGTTCAA CATCCAGATC 
GAGGACGAGG TCGTCACCGG CGCGCGCATC GTCTATGGCG GCATGGCCGG CACGCCGAAG 
CGGGCCACGG CCTGCGAAGA CGCCCTGGTC GGCCAGCCCT GGAACCGCGC CACGATCCAC 
GCGGCCGTCG AGGCCCTGGC CGGCGATTTC ACGCCCCTGA CCGACGCCCG CGCCTCGGCC 
GCCTATCGCG CCCTGACCGC CGGCAACATG CTGCGCAAGG TGTTCATCGA GTCGGCCCGA 
CCCGACCTGG AGACCCGTGT GTCGGAGGCG GCCCATGGCT GA

Protein sequence

MAPGQQRGVR FLLNGEPVEA EGVDPTRTLL EYLRGDLRRT GTKEGCAEGD CGSCTVLVGE 
LDGEAPNPKV AWRAVNSCIQ FVPMLDGKAV ISVEGLAPKN ERGDTPHPVQ AAMVEHHGSQ 
CGFCTPGFIM SLYGRAVAAK GTDAPIDEVL AGNLCRCTGY GPIIAAAEAI PGEAAPDVAD 
KLAALRRDAA LSLDYADPIA GVTRRWFAPR SADALAETYA AHPDAVVVAG ATDVGLWVTK 
LRKPLETLID IGQVAELKRI ERANGGVRIG AGVRYVDALE TLSGLYPDLG AMMRRLGSTQ 
VRNSGTIGGN IANGSPIGDM PPALIAAGAT LILRHWNERR VLPLEDFFIA YGQQDRRPGE 
FVEAVLVPDP APGALFKVFK LSKRFDQDIS AVCGAFNIQI EDEVVTGARI VYGGMAGTPK 
RATACEDALV GQPWNRATIH AAVEALAGDF TPLTDARASA AYRALTAGNM LRKVFIESAR 
PDLETRVSEA AHG