Gene Jann_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1997
Symbol
ID	3934450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1997294
End bp	1998562
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	61%
IMG OID	637904353
Product	phage integrase
Protein accession	YP_509939
Protein GI	89054488
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.559264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.395324
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCATTG CAAAGAGAGG CCGTCTCTAT CACCTCCGAC GCCGCGTCCC GCGCCGGTAT 
TGCGGGGTTG AGCCGCGCGA AACCGTGTGG ATCAGCCTGC ACACTGACTC TGAGACAGTG 
GCCATGAGCA AGGCGGACCG CGCATGGAGC CAGATGATTG AGGCTTGGGA AGCACGTTTG 
GCCGGGAACA GTGACGATGC AGAGGCGCGA TACGAGGCAG CGCGTGACCT GGCTCGGGTT 
CGAGGCTTTC GGTATCTGGA CGTCGGTGCC GTCGCGAAGT TACCTGTAGA AGACGTTGTC 
GAGCGTGTGG AAGCAATTCC AGCCACGATG GATCAACTGG ACGCCATTGA GGGCGCTGCT 
CTTCTTGGAG CGGCTCCTGA GCCTTGTACA ACGGTCACAA AGACGCTAGA GCTATACTGG 
ACGCTTGCCC GTGAGAAGAC CTTTGGCAAA AGCGAAGACC AACTGCGCCG TTGGGAGGCG 
CCCCGCAAGA AGGCTATCAA GAACTTCGTT GCCATCGTCG GCGACAAGGA CATCGCCAAC 
ATCACCCGCG ACGACATGCT GGACTTCCGC CAGCACTGGC TCGACCGGAT CGAGGCCGGC 
GAGGTCACGG CGAACTCGGC CAACAAGGAC CTGATCCATC TCGGCGACGT GCTTAAGACC 
GTGAACACGA TGAAGCGGTT GGGGCTCATG CTGCCCTTGG GCGAGTTATC CTTCAAGCAG 
GGTGAGGCGC GAACCCGCCC ACCGTTCAGC GAAGACTGGA TCACAACGCG GTTGCTGGCC 
CCGGGCGCGC TGGACGGATT GAACGACCAA GCGCGCGGCA TCTTACTGGG GATGGTGAAC 
ACCGGCTATC GCCCATCCGA GGGGGCCGCG TTGACGGCAG ACACGATCCG GCTCGATTGC 
GACGTGCCGC ATATTTCGAT TGAAGCTGAT GGCCGTCAGC TGAAGTCACA CTTCGCCCGG 
CGGGTGATCC CTCTGGCTGG CGCTTCGTTA GAGGCCTTCA AGCAATTCCC TGACGGCTTC 
CCCCGCTACC GCAACAGCGC CAGCCTAAGC GCGGTGGTTA ACAAGTTCCT CCGCACCAAC 
GGCCTGCTCG AAACCCCGCG TCACTCATTT TACTCGCTCC GGCACTCCTT CGAGGATCGC 
ATGCTCGCCG CCGGGATCGA CGACCGGATA AGGCGGGATT TGTTTGGTCA TCGATTAGAT 
CGGGAACGGT ACGGAAAAGG TGCGTCGCTC GAACATGTCG CCGAACTCGT CGGTCGGGTC 
GCTTTCTGA

Protein sequence

MGIAKRGRLY HLRRRVPRRY CGVEPRETVW ISLHTDSETV AMSKADRAWS QMIEAWEARL 
AGNSDDAEAR YEAARDLARV RGFRYLDVGA VAKLPVEDVV ERVEAIPATM DQLDAIEGAA 
LLGAAPEPCT TVTKTLELYW TLAREKTFGK SEDQLRRWEA PRKKAIKNFV AIVGDKDIAN 
ITRDDMLDFR QHWLDRIEAG EVTANSANKD LIHLGDVLKT VNTMKRLGLM LPLGELSFKQ 
GEARTRPPFS EDWITTRLLA PGALDGLNDQ ARGILLGMVN TGYRPSEGAA LTADTIRLDC 
DVPHISIEAD GRQLKSHFAR RVIPLAGASL EAFKQFPDGF PRYRNSASLS AVVNKFLRTN 
GLLETPRHSF YSLRHSFEDR MLAAGIDDRI RRDLFGHRLD RERYGKGASL EHVAELVGRV 
AF