Gene Jann_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1850
Symbol
ID	3934301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	1836588
End bp	1837697
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	60%
IMG OID	637904204
Product	hypothetical protein
Protein accession	YP_509792
Protein GI	89054341
COG category	[S] Function unknown
COG ID	[COG4260] Putative virion core protein (lumpy skin disease virus)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.129812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0309289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATTA TGGATTTTCT CAAAGGTCAA TTTATTGACG TCATCGAATG GACCGATGAT 
AGCCGGGACA CGATGGTCTA TCGCTTCGAG CGCTATGGCC ATGAAATCAA GTACGGTGCC 
AAGCTGACGG TGCGCGAAGG CCAGGTTGCG GTCTTCATCC ACGAAGGCCA GCTGGCCGAC 
GTCTTCACCC CCGGTCTCTA TATGCTCGAG ACCAACAACA TGCCGATCAT GACGTCCCTT 
CAGCATTGGG ACCATGGCTT CAGCTCTCCG TTCAAGTCCG AGATCTACTT CGTGAACACG 
TCGCGGTTCA CGGACCTCAA GTGGGGCACG AAAAACCCCA TCATGATCCG CGACAGCGAT 
TTCGGCCCCA CGCGCATCCG CGCCTTTGGC ACCTACACCG TGAAGGTGAA GGATGCGGGC 
CTGTTCATGA CGGAAATCGT GGGCACGGAC GGCGAGTTCA CCACCGACGA GGTGACGCAC 
CAGATCCGCA ACATAATCGT GCAGCAGTTC AGCCAGGCCG TCGCGGGCTC GGGCATTCCG 
GTCCTTGATA TGGCGGCGAA TACCGGCCAG ATGGGCGAGG TCGTGGCCGA GAAGATCTCT 
GCCACTATCG GCTCCTACGG TCTGACCTTG CCGGAGCTGT ATATCGAAAA CATCTCCCTG 
CCGCCCGCGG TGGAAGAGGC GTTGGATAAG CGGACATCCA TGGGTGTTGT GGGTGACCTG 
AACAAATACA CCCAGTTCCA GACGGCAGAG GCGATGCGCG CGGCCGCCGA AAACCCCGGC 
GGCGGTGGCG GCATGGGCGA AGGTCTTGGC ATGGGTATGG GTATGGCGAT GGCCAACCAG 
ATGGCCAATA ACATGCATCA ACCGCACCAG GCCGCGCACG CAGCCCCTCC GCCGCCCCCG 
GTGGAGCATG TCTGGCACAC GGCCGAGAAC GGGGCCACGA AAGGCCCGTT CTCCAAGGCG 
TCGCTCGGTC AGATGGCAAA CGACGGCTCC CTCACCCGTG ATACGATGGT CTGGACCGCA 
GGCCAGGACG GTTGGAAAAA GGCCGGTGAT GTGGATGAGC TGGCGCAGCT GTTTACCGTC 
ATGCCGCCCC CTCCACCGCC GCCGATGTAA

Protein sequence

MAIMDFLKGQ FIDVIEWTDD SRDTMVYRFE RYGHEIKYGA KLTVREGQVA VFIHEGQLAD 
VFTPGLYMLE TNNMPIMTSL QHWDHGFSSP FKSEIYFVNT SRFTDLKWGT KNPIMIRDSD 
FGPTRIRAFG TYTVKVKDAG LFMTEIVGTD GEFTTDEVTH QIRNIIVQQF SQAVAGSGIP 
VLDMAANTGQ MGEVVAEKIS ATIGSYGLTL PELYIENISL PPAVEEALDK RTSMGVVGDL 
NKYTQFQTAE AMRAAAENPG GGGGMGEGLG MGMGMAMANQ MANNMHQPHQ AAHAAPPPPP 
VEHVWHTAEN GATKGPFSKA SLGQMANDGS LTRDTMVWTA GQDGWKKAGD VDELAQLFTV 
MPPPPPPPM