Gene Jann_2068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2068
Symbol
ID	3934521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2077362
End bp	2078759
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	65%
IMG OID	637904424
Product	uracil-DNA glycosylase superfamily protein
Protein accession	YP_510010
Protein GI	89054559
COG category	[L] Replication, recombination and repair
COG ID	[COG1573] Uracil-DNA glycosylase
TIGRFAM ID	[TIGR00758] uracil-DNA glycosylase, family 4

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.803704
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.600316
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCAGAG GCGTCGCGCC CGCCGAGGTG ACCTGGGGCG GCACTGATAC GCCGCGCGGG 
CTGTTTGATG AGCCGTCATC CGTGGCGCAA AGCGGCGACA CGAGCGTTCC GCGCAGCTTC 
ATTTCCATGG CCGACAGTGT CGTCTGGCAC AGCGATCCGT CCCGCTTCGC GTGGCTCTAT 
GCGTTTTTGT GGCGGCTGCG CGACGCCCCG CATCTGATGA CAGATCGCGG TGACGCCGAC 
CTTGCCCGTC TGCGCGCGAT GGAGAAGAAC GTGCACCGCT GCCAGCACAA GATGAAGGCT 
TTCGTGCGTT TCCGCGACAT CGGTGAGGCG GAGACCCCCC GCCGGTCCTT TGCCGCCTGG 
TTCGAGCCGA CCCATCACAC GGTGGAGCCC ACGGCGGGCT TTTTCCAACG ACGTTTCGCC 
GATATGGACT GGCGCATCAT CACGCCCGAC ATTTCAGCCA TTTTCGAAGG TGGCACGCTG 
CGGTTCATTG AGGATCAGCC CAAACCGGGC CTGCCCGATG ACGCGAGCGA GGCGCTGTGG 
ATCACGTATT ATCGCAACAT CTTCAATCCG GCGCGCTTGA AGGTGCAGGC GATGCAGTCC 
GAGATGCCAA AAAAGTACTG GAAGAACCTG CCGGAGGCCG CTGCGATCCC GGATCTGATC 
GCCACCGCGC CCGCCCGTGC CCGCGCGATG GCCGAGGCCG CGCCGACCTT GCCGCCAACC 
CGCATGGCCT CCGCGCAGGA GCAGCAGCGC GCGTTTGCAT CGTCTTGGGA GGGCTCGGAT 
GATGCGTTTC TGGCAGCGGT GAAGGGCTGC ACGCGCTGTC CGCTCCATCG ACACGCCACG 
CAGACCGTGC CCGGGGAAGG GCCGGCCAAG GCCGCGCTGA TGATCGTGGG GGAGCAGCCG 
GGCGATCAGG AGGATTTGCA GGGTCGCCCC TTCGTGGGGC CCGCGGGTCA CGTGTTCGAT 
CAGGTCGCGG CGGAGGTGGG GTTGGACCGC GCAACCGCCT ACATCACCAA CGCCGTGAAG 
CATTTCAAGT TCGTGCCACG GGGCAAGCGG CGTTTGCATC AGCGGCCCAA TGCGGGGGAG 
GTCGCCTATT GCAAATGGTG GCTGGAGGCA GAGATTGCGC GCGTGACCCC CAAGCTGATC 
CTGGCCATGG GGTCCACCGC GGCGCTTGCA TTGACCGGGT CGGGCAACAA CCTGCTGAAA 
CGGTGCGGGA CAATTGAAGC CGTCGCCGGG CGACCACCTG TCCTGATCTC TTTGCACCCC 
TCATACATCT TGCGGATCAA GGATGCCGAT CAGCGGGCGG AGGCCCGGCA GATGTACCAG 
CGTGATCTCG GGCGCGCCAC ACAGATGGTG CAGGAGCGGG CCGGGCCGAT CGGTCTCGCA 
GAAAACGGGC CGGAGTGA

Protein sequence

MARGVAPAEV TWGGTDTPRG LFDEPSSVAQ SGDTSVPRSF ISMADSVVWH SDPSRFAWLY 
AFLWRLRDAP HLMTDRGDAD LARLRAMEKN VHRCQHKMKA FVRFRDIGEA ETPRRSFAAW 
FEPTHHTVEP TAGFFQRRFA DMDWRIITPD ISAIFEGGTL RFIEDQPKPG LPDDASEALW 
ITYYRNIFNP ARLKVQAMQS EMPKKYWKNL PEAAAIPDLI ATAPARARAM AEAAPTLPPT 
RMASAQEQQR AFASSWEGSD DAFLAAVKGC TRCPLHRHAT QTVPGEGPAK AALMIVGEQP 
GDQEDLQGRP FVGPAGHVFD QVAAEVGLDR ATAYITNAVK HFKFVPRGKR RLHQRPNAGE 
VAYCKWWLEA EIARVTPKLI LAMGSTAALA LTGSGNNLLK RCGTIEAVAG RPPVLISLHP 
SYILRIKDAD QRAEARQMYQ RDLGRATQMV QERAGPIGLA ENGPE