Gene Jann_4041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_4041
Symbol
ID	3936529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	4143307
End bp	4145061
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	67%
IMG OID	637906426
Product	heparinase II/III-like
Protein accession	YP_511983
Protein GI	89056532
COG category	[S] Function unknown
COG ID	[COG5360] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC CCCTTCCCCC GTCCCCCGCA AGGCCGCGCC CGCGTGACGG GCTGGCCGCG 
CGCATCCGCC GTGAGTGGGC GGCGCGTAGG GCGGGGTTGG GCCCCCGGGC GCAGGGGTTC 
CTGTGGCAAC CGGAACCCCG GTTTCCCGGG TCTGCGGTCC GGGGGCGGCA ATTGTTGGCA 
GGCAATTTCC GCCTGGGCGG GGCATTGGTT GAGATTGACG GGATCAGCCC CTGGGACATC 
ATTCCGCCCA ACGACGAGTT TGAGGCTGCG CTGCACGGAT TTGCCTGGCT CGACGATCTG 
GTGGCCGTCC CCAACAACGA GGGCCGCGCC ATGGCACAGC GATGGCTGGC CGAGTGGACG 
ACCCGCTATG GCAAGGGTCG GGGACCGGGG TGGAGCGCGG ATCTGACAGG CCGCAGGCAG 
ATCCGCTGGA TCACCCACAC CCTGTTTTTG ATGAACGGCC AGGCCCCGGC GGACGGCAGG 
TTGTTCCACC TCGCGCTGTC GCGGCAAGCC AACTACCTTG CCAGACACTG GCGGCGGGCA 
TCACCCGGTT TGGCGCGGTT CGAAGCGCTG ACCGGTCTGA TTTACTCTGC CTGCGCACTG 
ATCGGGATGG AGACGCGGCT TGAGCCCGCG CTGACGGGCC TTGCGCAGGA TTGCGCAACA 
CAGATCGACG CCCAGGGCGG CATCGTCACG CGCAACCCGG AAGAATTGCT GGAGGTGTTC 
GTGTTGCTGA CCTGGATCGC CCAGATCCTG CAGGAAACCG GCAAACGCGC CGACCCGGCA 
GTGGATACCG CGATCATGCG CGTGGCCCCA ACCCTGAGGG CGTTGCGCCA TGCCGACGGC 
AGTCTTGCGC GGTTCCACGG CGGCGGTCGC GGCGCGCCGG GGCGGCTGAT CGGGGCGTTG 
GTGCAATCCG GCGTGCGACC ATCGCGGGTG CGGGGGCTGG CAATGGGCTA TGCGCGTATG 
GCGTCGGGCC GGGTGACGAT AATCACCGAC GCGGCCCCGC CGATGATCGG CACGGGCTCC 
ACCAATGCCC ATGCGGGCAC GCTGGCGTTT GAGATGTGTT CGGCCAATCA CCCGCTGATC 
GTCAATGCCG GGTCCGGTGC CAGTTTTGGG CCGGAATGGC GGCGCGCGGG TCGCGCCACG 
GTCAGCCATT CCACCGTGTC TCTGGAAGGA TATTCGTCAT CGCGCTTTGC CGAGAAGGCG 
CTGCATGATC CCCCCGAACG CCAGAGTTTT GAGAACGGCC CCAGCGACGT GTCGGTGCAG 
GTGTCCGAGA TCACCGGCGG TGAAGGGCTG GTGTTGTCCC ACGATGGCTG GCGCAAGACC 
CACGGGCTGG TGCATCTGCG CTCTCTCACG CTGGAGGATA ACGGCAATCT TCTGCGCGGC 
GAAGATGGCC TCGCCGCATT GGATGGCCAT GACCGGGATC GCTTCATGCG CGTCAATCGC 
AGCTTGCCCT CTGACGTCGG TCTGCGCTTT GCCGCGCGCT TCCATCTGCA TCCCGATGTG 
GTGGTGGAGT TGGATATGGG CGGGGCCGCG ATTTCGCTGA CATTGCCCAC CGATGAGGTC 
TGGGTGTTCC GCCACGGCGA CGAGGCCGAG CTGTCGATCC GCCCTTCCGT CTATTTCGAT 
GCAACGCGCC TGAAACCCCG CGCGACAAAA CAGATTGTTT TAACCTCCCG CGTCAGGGGG 
TATGGAGCGG CAGTCAGCTG GTCCATCGCG CGCCCCTCGG CGCTGTTGCC CGCCCCCGAC 
GACCTGTCTT TGTGA

Protein sequence

MSEPLPPSPA RPRPRDGLAA RIRREWAARR AGLGPRAQGF LWQPEPRFPG SAVRGRQLLA 
GNFRLGGALV EIDGISPWDI IPPNDEFEAA LHGFAWLDDL VAVPNNEGRA MAQRWLAEWT 
TRYGKGRGPG WSADLTGRRQ IRWITHTLFL MNGQAPADGR LFHLALSRQA NYLARHWRRA 
SPGLARFEAL TGLIYSACAL IGMETRLEPA LTGLAQDCAT QIDAQGGIVT RNPEELLEVF 
VLLTWIAQIL QETGKRADPA VDTAIMRVAP TLRALRHADG SLARFHGGGR GAPGRLIGAL 
VQSGVRPSRV RGLAMGYARM ASGRVTIITD AAPPMIGTGS TNAHAGTLAF EMCSANHPLI 
VNAGSGASFG PEWRRAGRAT VSHSTVSLEG YSSSRFAEKA LHDPPERQSF ENGPSDVSVQ 
VSEITGGEGL VLSHDGWRKT HGLVHLRSLT LEDNGNLLRG EDGLAALDGH DRDRFMRVNR 
SLPSDVGLRF AARFHLHPDV VVELDMGGAA ISLTLPTDEV WVFRHGDEAE LSIRPSVYFD 
ATRLKPRATK QIVLTSRVRG YGAAVSWSIA RPSALLPAPD DLSL