Gene Jann_1356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1356
Symbol
ID	3933803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	1320088
End bp	1321344
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	62%
IMG OID	637903706
Product	extracellular solute-binding protein
Protein accession	YP_509298
Protein GI	89053847
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0142784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.791743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGA AGAAACTTAC CGCCAGCCTG CTGGCCACAA CCATGCTGGT CGGCACCGCC 
GCATCTGCGC AGGATGTGAC GCTGACGATC GAAAGCTGGC GCAACGACGA CCTGACGCTT 
TGGCAGGACG TCATTATCCC GGCGTTTGAA GCCGAAAACC CCGGCATCTC GGTTCAGTTC 
ACGCCGTCTG CGCCTGCGGA ATACAACGCC GTCCTGAACT CGAAGCTGGA CGCAGGCTCC 
GCCGGTGACC TGATCACCTG CCGTCCGTTT GATGCGTCCC TCGCGCTCTA TGAGGCGGGT 
CACCTGACCG ACCTCAGCGA TCTGGACGCG ATGGCCAACT TCTCGGACGT GGCGCAATCC 
GCATGGCAGA CCGATGATGG CGCGGCGACC TTCTGCATGC CGATGGCCTC CGTGATCCAC 
GGCTTCATCT ACAACGCCGA CGCCTTCGCG GAGCTTGGCT TGGAAGAGCC CACGAACGTT 
GACGAATTCT TCGCCGTGCT CGACGCGATT GAGGAGGACG GCAATTACAT CCCGATGGCC 
ATGGGCACCG CCGACCAGTG GGAAGCGGCC ACCATGGGCT ACAACAATAT CGGGCCAAAC 
TACTGGCGCG GCGAAGAAGG TCGCCTCGCC TTGATTGCCG GTGAACAATC ACTCACGGAT 
CCCGAATGGG TCGGACCGCT GGAACAGCTT GCACGTTGGG GCGATTACCT CGGCCGCGGC 
TATGAGGCAC AGACCTATCC GGATAGCCAA AACCTGTTCA CCTTGGGGCG CGCCGCGATT 
TATCCGGCAG GCAGCTGGGA AATCACCGGC TTCAACGCGC AGGCCGACTT TGCTATGGGT 
GCCTTCGCCC CGCCGGTGCC GAACGCGGGC GATGAGTGTT TCATCTCGGA TCACACCGAT 
ATCGCCATCG GTCTGAACGC CGCCTCCCCC AATGCCGAAG CCGCACGCAC CTTCCTCAAT 
TGGGTTGGTT CGGCTGAGTT TGCCTCCATC TACGCCAACG CGCTGCCGGG CTTCTTCCCG 
CTGTCAAACG CCGAGGTTGA ACTGGAAGAT CCGCTGGCGC AGGAAATGAT TTCCTGGCGA 
GGGGAGTGTG AAAGCTCGAT CCGGTCCACC TACCAGATCC TGTCGCGCGG CACGCCGAAC 
CTGGAAAACG AGACGTGGAA CGCCTCCACC CAGGTGATCC GTGGCGCAGA AGCCCCCGCC 
GACGCCGCCG CGCGTCTGCA GGAAGGCCTC GCCTCCTGGT ACGAACCGCA GCAGTAA

Protein sequence

MSMKKLTASL LATTMLVGTA ASAQDVTLTI ESWRNDDLTL WQDVIIPAFE AENPGISVQF 
TPSAPAEYNA VLNSKLDAGS AGDLITCRPF DASLALYEAG HLTDLSDLDA MANFSDVAQS 
AWQTDDGAAT FCMPMASVIH GFIYNADAFA ELGLEEPTNV DEFFAVLDAI EEDGNYIPMA 
MGTADQWEAA TMGYNNIGPN YWRGEEGRLA LIAGEQSLTD PEWVGPLEQL ARWGDYLGRG 
YEAQTYPDSQ NLFTLGRAAI YPAGSWEITG FNAQADFAMG AFAPPVPNAG DECFISDHTD 
IAIGLNAASP NAEAARTFLN WVGSAEFASI YANALPGFFP LSNAEVELED PLAQEMISWR 
GECESSIRST YQILSRGTPN LENETWNAST QVIRGAEAPA DAAARLQEGL ASWYEPQQ