Gene Jann_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3037
Symbol
ID	3935508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3062843
End bp	3063940
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	64%
IMG OID	637905408
Product	polysaccharide export protein
Protein accession	YP_510979
Protein GI	89055528
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTTC CAGCCCTACT CATTGCCATC GCACTCGGAC TTGCCGCCTG TGGCCCCTCC 
GACGGCCCCT CTCAGTCGCA GGTCCGCAGC GATGCGCGGG CCGCAGATGT GCCGATCCTG 
CCGCTGAACC GGTCTGTCAT TGCCGCGCTC GGCACCTCGA CGCCCGGCGA GGGGTTCTCC 
CACGTCAGTC AGGTGCCCTA TTCACCCGGC GTTATTCGCG CCGGTGACGT GATCACCGTC 
CGCGTGTTCG AGACCTCCGA TGACGGCATG TTCTCGGTCG AAGATACCTC GACGCTGGAT 
CTCGGTGAAT TCGTGGTCTC GCCCGACGGC TACGTGTCCC TGCCGTTTGT GGGGGCCGTG 
CGGGTTGCGG GAAATAATGC GACAGGTGCG CAACGGCTGA TCACCAACGC CCTGCGCGAG 
TCTGCTGTCG ATCCGCAGGC CACTGTTTCG GTAACGGTCA GCGCGACCGA TAACTATACG 
GTTCAAGGCG GCGTTGCGTC GGGCGGCACG TATCAGCTGA CACCGCGCGG TGAGACAATC 
CTTGATGCAC TGGCCTCGGC GGGCGGTGCC GAGGGTGATC CGAACGAGAC GACTATCACC 
ATCCGGCGCG GGAGCGACAG CCGGACAGAG CTTTTGTCGA CGCTCCTTGC CGATCCGTCC 
CGCGATGCGA CTCTGCGCCC GGGCGATGCG GTGATTGTGG GGGGCGGTCA GGCCAGCTTC 
ATTGCCGATG GGGCGTTGTC CTCTCCCGGA GAATTTGACT TCGTCGAAGG CCAGTTGACC 
CTTGCGCAGG CGATTGCGCG GGCCGGCGGT TTGCAGGACA GCCGCGCCAA TCCACGCGCC 
GTCTACATCT TCCGACGGAT GCCTGTGGGT GAATCGTTTC TGCTGGAACA ACCGCCCGGA 
AATGATCCGA TCCGGGTGGC GGGCGATGTG ATTTTCCAGG CCGATTACAC CTCTCCCACC 
GGGCGCCTGG ATGCCGGACA ATTCATGCTG CGCGACGGCG ATGTGCTTTA TGTGGGCAAT 
TCGCCCGTGT CGGAGTTCCT GAAGTTCTTC CAGATCTTCG AGCGTCCGCC CGAGATCCCT 
GCCGTTCCCG GTCAGTAA

Protein sequence

MRLPALLIAI ALGLAACGPS DGPSQSQVRS DARAADVPIL PLNRSVIAAL GTSTPGEGFS 
HVSQVPYSPG VIRAGDVITV RVFETSDDGM FSVEDTSTLD LGEFVVSPDG YVSLPFVGAV 
RVAGNNATGA QRLITNALRE SAVDPQATVS VTVSATDNYT VQGGVASGGT YQLTPRGETI 
LDALASAGGA EGDPNETTIT IRRGSDSRTE LLSTLLADPS RDATLRPGDA VIVGGGQASF 
IADGALSSPG EFDFVEGQLT LAQAIARAGG LQDSRANPRA VYIFRRMPVG ESFLLEQPPG 
NDPIRVAGDV IFQADYTSPT GRLDAGQFML RDGDVLYVGN SPVSEFLKFF QIFERPPEIP 
AVPGQ