Gene Caul_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2058
Symbol
ID	5899513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2195850
End bp	2196926
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	641562547
Product	NADH:flavin oxidoreductase/NADH oxidase
Protein accession	YP_001683684
Protein GI	167646021
COG category	[C] Energy production and conversion
COG ID	[COG1902] NADH:flavin oxidoreductases, Old Yellow Enzyme family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.416223
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTC TGTTCGATCC GCTCCGGCTT GGCGACCTCG AGCTTCCCAA TCGCGTCGTG 
ATGGCGCCGC TGACCCGCCT GCGGGCTGGA CCAACCCAGA TTCCCAACGC CCTGATGGCG 
GAATACTACG CCCAGCGCGC TTCGGCCGGC CTGTTGATCA CCGAAGGCGT GCCGGTCAAC 
CCGCAGGGCG TCGGCTACCA GGGCGTGCCC GGCATCTGGT CCCAGGAGCA GGTCGCCGGC 
TGGAAGCAGG TCACCAAGGC CGTGCACGAC AAGGGCGGTC GCATCTTCAT GCAGATTTGG 
CACGTGGGCC GAATATCCGA TCCGTCGTTC CACGATGGCG CGGCGCCGGT TGGCCCCAGC 
CCCATCCCGG CCAAGGGCCA CGTCAGCCTG TTGCGTCCGG AACGCCCCTA CCCCACCCCC 
CGCGCCTTGA CGACCGACGA GGTGGTGGGC GTGGTCGAGG CCTTCCGCCA GGCCGCGCGG 
AACGCCAAGG ACGCCGGCTT CGACGGCGTC GAGTTGCACG GCGCCAACGG CTATCTGCTC 
GACCAATTCC TGCAGGACGG CTCCAATCAG CGCACCGACC GCTACGGCGG TTCGATCGAG 
AACCGCGCCC GCCTGATGCT GGAAGCCGCC GACGCCGCGA TCTCGGTGTT CGGCCCGGGC 
CGCGTCGGCA TGCACCTGGC CCCGCGCGCC GATTCCCACT CGATGGGCGA CAGCGACCTT 
GCCGCGACCT TCGGCTATGT GGCCAGGGAA CTGGGCAAGC GCGGCATCGC CTTCCTCTGC 
GCGCGCGAAT ATGACGGCCC CGACAGCCTG GCCGCGGACC TTCGCAAGGC GTTCGGCGGC 
GTCTATATCG TCAACGAGCG GTTCACCGCC GCCACCGCCC AGGCGGCGCT GGATGCCGGC 
AAGGCCGACG CCGTGGCCTT CGGCAAGGCG TACATCGCCA ATCCGGACCT GGTGGAGCGC 
CTGCGACTCG GCGCGCCGCT CAATGATCCG GATCCATCGA CCTTCTACGG CGGCGACGGT 
CGCGGCTACG TGGACTATCC CGCCCTGAAG ACCCTGGTCC CAACCGCCGC CGAATAG

Protein sequence

MTTLFDPLRL GDLELPNRVV MAPLTRLRAG PTQIPNALMA EYYAQRASAG LLITEGVPVN 
PQGVGYQGVP GIWSQEQVAG WKQVTKAVHD KGGRIFMQIW HVGRISDPSF HDGAAPVGPS 
PIPAKGHVSL LRPERPYPTP RALTTDEVVG VVEAFRQAAR NAKDAGFDGV ELHGANGYLL 
DQFLQDGSNQ RTDRYGGSIE NRARLMLEAA DAAISVFGPG RVGMHLAPRA DSHSMGDSDL 
AATFGYVARE LGKRGIAFLC AREYDGPDSL AADLRKAFGG VYIVNERFTA ATAQAALDAG 
KADAVAFGKA YIANPDLVER LRLGAPLNDP DPSTFYGGDG RGYVDYPALK TLVPTAAE