Gene Jann_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3937
Symbol
ID	3936418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	4035087
End bp	4036637
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	64%
IMG OID	637906315
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_511879
Protein GI	89056428
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.611638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA TGACGATTAT TCCCTCCGCC GGGGTCTCCA TCCCTGCGCC TTTTCGGGGG 
CGGCACCTGA TCGGTGGCGT GTGGTGCGAC AGTGCCGATG GTGCAGTGTC CGACAGGCAC 
TCCCCGGCCC ATGGCACCCA CGTCAGCACG GCTGCCAGGG GCGGCGCGAC GGAGGCGGAC 
GCTGCCATTG CGGCGGCTCG GACCACCTTC GATGCGGGCG ATTGGCCGTT CTCCAGCGGG 
GCATCGCGCG CGGCGATCCT GCTCAAAGTC GCGGACCTGA TTGAGCGGGA TCTGGACCGG 
ATCGCCCTTC TGGAAACGCT CGAATCCGGC AAGCCGATCA GCCAGGCAAA AGCCGAGATC 
GGCGGCGCGG CGGACCTGTG GCGCTACGCT GCCAGCCTCG CGCGGATGAT CCATGGCGAT 
AGCCACAATT CCCTTGGCGC GGACATGTTG GGTGTCGTCC TGAAAGAGCC CATCGGCGTC 
GTGTCCATGA TCACGCCCTG GAACTTTCCG TTCCTGATCG TGTCCCAAAA GTTGCCCTTC 
GCGCTGGCGG CAGGCTGCAC GGCGGTGATC AAACCGTCGG AACTGACGCC GTCCACGACC 
TGCATTCTGG GTGAATTACT GTTCGAGGCA GGGCTGCCCG CAGGGGTCGC CAACATCGTG 
CTGGGGTTTG GCGACCCGGT GGGCGAGGTT CTGTCGACGG ATCCACGCGT GGATATGGTC 
AGCTTCACCG GCTCCACCGG CGTCGGCAAA CAGATTTCCG CAGCCGCCAG CGGCACGTTG 
AAGAAGGTCT CGCTGGAGTT GGGCGGCAAG AACCCGCAGG TGATCTTCCC CGACGCCGAT 
TTGGATCAGG CCGCCGATGC GATCACCTTC GGCGTCTATT TCAACGCGGG CGAATGCTGC 
AACTCCGGCT CCCGTATCAT CGTGCATGAA GATGTGGCGG AGGAGCTGAC CGCAAAGGTC 
GTCGCCCTGT CGCGCCGCGT GCCGTTCGGC GACCCGCTGG ACCCGGCCAC CCAAGTCGGC 
GCGATCATTT CGCCCGAGCA TATGGCGAAG ATCGACGGCT ATGTGCAGGA CGCCGTGAAG 
GATGGCGCGC GGCTTGCCAT CGGTGGCGCG GCGCTGGACG TAGACGGTGT GGGGCCGCAA 
TTCTACCAGC CCACGGTGGT CACCGATCTG CGCGAAGACA TGGCCATCGC GCGTGATGAG 
GTCTTTGGTC CGGTGCTGGC TGTGCTGACG TTTCGGACCC TCGATGACGC CTTAAGTCTT 
TGCAACAACG CAACTTATGG CCTGTCTGCG GGGGTTTGGT CCAAGGACAT GTCCACCTGC 
CTGTCATTCG CGCGCCGGGT GCAGGCGGGG ACCGTGTGGA CAAACACATG GATGGACGGC 
TTCCCGGAAA TGCCTTTTGG CGGGGTCAAG GAAAGCGGGC AGGGACGCGA ATTGGGGCGC 
TATGGTCTTG AGGAATTCCT GGAGGTCAAA ACCGTCCAGA TGCGCATCGG CGACAGCCGT 
CAGATGTGGG TCACGCCGGA GGGCGTGCAA TCAGCGGATC TCTCTGAATG A

Protein sequence

MTEMTIIPSA GVSIPAPFRG RHLIGGVWCD SADGAVSDRH SPAHGTHVST AARGGATEAD 
AAIAAARTTF DAGDWPFSSG ASRAAILLKV ADLIERDLDR IALLETLESG KPISQAKAEI 
GGAADLWRYA ASLARMIHGD SHNSLGADML GVVLKEPIGV VSMITPWNFP FLIVSQKLPF 
ALAAGCTAVI KPSELTPSTT CILGELLFEA GLPAGVANIV LGFGDPVGEV LSTDPRVDMV 
SFTGSTGVGK QISAAASGTL KKVSLELGGK NPQVIFPDAD LDQAADAITF GVYFNAGECC 
NSGSRIIVHE DVAEELTAKV VALSRRVPFG DPLDPATQVG AIISPEHMAK IDGYVQDAVK 
DGARLAIGGA ALDVDGVGPQ FYQPTVVTDL REDMAIARDE VFGPVLAVLT FRTLDDALSL 
CNNATYGLSA GVWSKDMSTC LSFARRVQAG TVWTNTWMDG FPEMPFGGVK ESGQGRELGR 
YGLEEFLEVK TVQMRIGDSR QMWVTPEGVQ SADLSE