Gene Caul_4934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4934
Symbol
ID	5902396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5331554
End bp	5332672
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	66%
IMG OID	641565454
Product	FAD dependent oxidoreductase
Protein accession	YP_001686552
Protein GI	167648889
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.2077
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.974431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAAT TGCTCAACGC CGATGTTGTG GTCGTCGGCG CCGGTGTCGT GGGTTTGGCC 
TGCGCCGCGG CCTTGGCCAA GCATCATTAC GTGCTGGTTC TCGAAGCCGA GACAGCGATC 
GGCACCCAGA CGTCGTCCCG CAACAGCGAA GTGATCCACG CCGGCATCTA CCATCCCACC 
GGCAGCCTCA AGCATGAGCT TTGTGTGCGC GGTCGACGTT TGCTGTATCC CTACCTGGAA 
GCTCGGCAGG TCTCCTATCG GCGTAGCGGC AAGCTGATCG TGGCGACCAG CGCTGAGGAG 
GATTCCAAGG TCGAGGCGAT CCATCGTCAG GCGTTGGGCA ACGGCGTCGA AGGCATGCGA 
TTGCTCAGCG GGGCCGAGGC CCGTGCTCTG GAGCCCAATC TGCGTTGCAC CTTGGCCACG 
CGATCTTCGG AAACCGGCAT CGTCGATAGC CATGGCTTGA TGCTGGCCCT GCAAGGCGAG 
ATCGAGGATG CCGGAGGAGC GATCGCCTTC GGCGCGCCCG TGCTGAGCGG CGAAATTCTC 
GACGGCGGCG GCTTTGAGCT CGATGTCGGC GGCGAGCACC CAGTGCGCTT GCGCTGCGCC 
ACCCTGGTCA ACGCCGGCGG CCTGAAGGCT CAGGCCCTCG CCGCCGCGAT GAGGCGCCGT 
CCCAACGCCG TGCCTCCTCT GAGCTTGGCC AAGGGATCCT ATTTTAGCTA CGGGGGCGCG 
CCGGCCTTTT CGCAATTGAT CTATCCCGCC CCCGTGGACG GCGGTCTGGG CGTCCACGTG 
ACCTTGGACT TGGCGGGGCG GATGCGTTTT GGCCCCGACG TCGAGTGGCT GGATCACGAT 
GATCCGGACT CCGTCGACTA CGCTGTTGAC CCGCGTCGGG CGGACGCCTT CTATGCCGCC 
GTGCGTCGCT ATTGGCCCGG CCTGCCGGAC GGCGCCCTGG TCCCCGACTA CGCCGGTTGC 
CGTCCAAAGC TCAGCGGTCC CGGCGCCGCC GCCGATTTTC GGATAGACGG GCCGCGGACG 
CACGGCCAAG AGGGGCTCGT GGAGCTGTTC GGCGTTGAAT CGCCGGGGCT CACCAGCGCG 
TTGGCGATCG CGGAATACGT GGTTTGCGCG CTGTCTTAG

Protein sequence

MTELLNADVV VVGAGVVGLA CAAALAKHHY VLVLEAETAI GTQTSSRNSE VIHAGIYHPT 
GSLKHELCVR GRRLLYPYLE ARQVSYRRSG KLIVATSAEE DSKVEAIHRQ ALGNGVEGMR 
LLSGAEARAL EPNLRCTLAT RSSETGIVDS HGLMLALQGE IEDAGGAIAF GAPVLSGEIL 
DGGGFELDVG GEHPVRLRCA TLVNAGGLKA QALAAAMRRR PNAVPPLSLA KGSYFSYGGA 
PAFSQLIYPA PVDGGLGVHV TLDLAGRMRF GPDVEWLDHD DPDSVDYAVD PRRADAFYAA 
VRRYWPGLPD GALVPDYAGC RPKLSGPGAA ADFRIDGPRT HGQEGLVELF GVESPGLTSA 
LAIAEYVVCA LS