Gene Jann_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1474
Symbol
ID	3933921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1443259
End bp	1444635
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	62%
IMG OID	637903824
Product	cytosine deaminase-like protein
Protein accession	YP_509416
Protein GI	89053965
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.534855
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTCA AGACGCTCCC CTCTGACAAT CTGCGGTTGG AGAACGTGAC GATTCCTGGG 
TGCCTGATCG GGCAATCGGG CGTTGTGCGC ACAGCGCTGA GTATCGCCGA CGGTGTGATC 
GCCGCGAGTG GTGGCACGCC GGTCGATATG AGGGGGGCGA TGGTGTTTCC CTGTTTCGTC 
GACATGCACA CGCATCTGGA CAAGGGCCAT ATCTGGCCCC GCTCGCCCAA TCCCGACGGC 
ACGTTCATGG GGGCGCTGGA GACGGTGCGC GCAGACAAAT CGGGGCGGTG GGACAGTGTT 
GATCTGCCGC CGCGCATGAA TTTCAGCCTG AACTGCGCCT ACGCCCACGG CACGCGGGCC 
ATTCGAACCC ATCTGGACTA TTTTGGAGAG ACTGACGAGG CGCGGGTCAG CTGGGACGTC 
TTCGCACAGA TCCGTGACGA CTGGGCCGGT CGGATTGATC TTCAGGCCGC TGTGTTGACG 
GGGATCGACA TGGCCGCTGA TGCCGGCGCT TTGGCAACTT GCGCAGACCT TGTGGCGTCC 
CATGGCGGCG CTCTCGGGGC CGTGACCTAT CCGGAGCCGG ACCTGCGCGC TTGGTTAACT 
GCATACTTTG AGGCGGCTGC GCTGCGTGGG ATGGACCTGG ATTTCCACGT GGATGAGACA 
ATGGATCCAG AGGTTAACAC CCTTAAGGAT ATTGCGGAAA TTGTGCTAGA GACAGGATTT 
AAAGGGAAAA TCACCGTGGG CCATCTCTGC TCCCTGTCGG TGATGGAAGA CGCGGTGGCC 
ATGGCCACTC TTGATCTGGT CGCCAAGGCC GGGCTCGATG TCGTCAGTCT GCCGATGTGC 
AACCTGTATC TGCAAGACCG CCACGCCGCG CGCACGCCGC GAGGCCGGGG CATCACTTTG 
GTGCACGAGA TGAAGGCGCG GGGCATCAAC GTCAGTTTCG CCTCAGACAA CACCCGAGAT 
CCGTTCTATG CCTACGGTGA TATGGACATG ATCGAGGTGA TGCGGGAGGC CACGCGCATT 
GGCCATCTGG ACCACTCCGA TGACGATTGG ACCCATGCGT TTCTGGGCAA TCCTGCCCGG 
GCCTGTGGCG TCACGGCACC GTCGTTGATG CCCGGAGCAC CCGCCGATTT GGTGATTTGC 
CGCGCCCGCG AATGGACGGA ACTTTTCGCC CGCCCGCAGG CTGACCGGAT CGTGCTGCGT 
GATGGGCGCC AGATTGATCG CGCTTTGCCG GATTACGCCG AATTGGATTA CCTTATGACG 
CCCTCAAGCA GCGAAGCGGT GGGGCAGAAA GCATCGCCCT CAAGCAGCGA AGCGGTAGGG 
CAGCACGCAT CGCCCTCAAG CAGCGACGCG GTCGGGCAGG GAGAGATCGC CAAATGA

Protein sequence

MDFKTLPSDN LRLENVTIPG CLIGQSGVVR TALSIADGVI AASGGTPVDM RGAMVFPCFV 
DMHTHLDKGH IWPRSPNPDG TFMGALETVR ADKSGRWDSV DLPPRMNFSL NCAYAHGTRA 
IRTHLDYFGE TDEARVSWDV FAQIRDDWAG RIDLQAAVLT GIDMAADAGA LATCADLVAS 
HGGALGAVTY PEPDLRAWLT AYFEAAALRG MDLDFHVDET MDPEVNTLKD IAEIVLETGF 
KGKITVGHLC SLSVMEDAVA MATLDLVAKA GLDVVSLPMC NLYLQDRHAA RTPRGRGITL 
VHEMKARGIN VSFASDNTRD PFYAYGDMDM IEVMREATRI GHLDHSDDDW THAFLGNPAR 
ACGVTAPSLM PGAPADLVIC RAREWTELFA RPQADRIVLR DGRQIDRALP DYAELDYLMT 
PSSSEAVGQK ASPSSSEAVG QHASPSSSDA VGQGEIAK