Gene Jann_1497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1497
Symbol
ID	3933944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1467824
End bp	1468768
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	63%
IMG OID	637903847
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_509439
Protein GI	89053988
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000845092
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTTT TTCGCGCAAC TGCGACCAGT GCCCTCGCGT TAACCCTGAC CGCCGGGGCC 
GCGATGGCCG ACGCCCATGC AGACTGTGGC ACCGTGACCT TCTCGGACGT CGGTTGGACG 
GATATCACCG CCACGACAGC CGCGACCTCC GTCGTGCTGG AGGCTTTGGG CTATGAGACC 
GAGATCCTCG TTCTGTCCGT TCCGGTGACC TACACGTCGC TTGCGGAAGG GGATGTGGAT 
ATCTTCCTGG GCAACTGGAT GCCGACGATG GAAGCCGACA TCGCGCCCTA TCGTGAGGCG 
GGCACCGTCG ATACCGTCCG CGCCAACCTT GAGGGCGCGA AGTACACGCT GGCCACGAAC 
GCCGCCGGGG CCGCCCTCGG GATCACTGAT TTCGCCTCCA TCGTGGCGGC CATGGACGAG 
CTGGATGGCG AGATCTACGG CATTGAGCCC GGCAACGACG GCAACCGCCT GATCATGGAT 
ATGATCGAGG CCGACGCCTT TGGTCTGAGC GAGTTTGAAG TCGTCGAATC CTCCGAGCAG 
GGCATGCTGG CGCAGGTCGC CCGCGCCTCT GACCGGGACG AGCCCGTCGT TTTCCTCGGC 
TGGGAACCGC ATCCGATGAA TGCCAATTTC GATCTGACCT ATCTGGAAGG CGGCGATGAT 
TGGTTCGGCC CCAATCTGGG TGGCGCGACG GTCTTCACCA ACACCTCCGC TGGCTACGCG 
GACGCCTGCC CGAACGTCGG CGCGCTTCTG AACAATCTGG AATTCAGCCT CGCCATGGAG 
AACGAAATCA TGGGCGCGAT CCTGGACGAG GGCGAAGATC CTGCCGATGC CGCAACGGCC 
TGGATGGCCG CCAATCCGGA TGCTGTGATG GCCTGGCTTG ACGGTGTAAC AACCTTCGAC 
GGCGGCGACG CATCCGCGGC CGTGTCCGAG GCACTGGGCC TCTAA

Protein sequence

MTLFRATATS ALALTLTAGA AMADAHADCG TVTFSDVGWT DITATTAATS VVLEALGYET 
EILVLSVPVT YTSLAEGDVD IFLGNWMPTM EADIAPYREA GTVDTVRANL EGAKYTLATN 
AAGAALGITD FASIVAAMDE LDGEIYGIEP GNDGNRLIMD MIEADAFGLS EFEVVESSEQ 
GMLAQVARAS DRDEPVVFLG WEPHPMNANF DLTYLEGGDD WFGPNLGGAT VFTNTSAGYA 
DACPNVGALL NNLEFSLAME NEIMGAILDE GEDPADAATA WMAANPDAVM AWLDGVTTFD 
GGDASAAVSE ALGL