Gene Jann_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1501
Symbol
ID	3933948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1471275
End bp	1472318
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	637903851
Product	ABC transporter related
Protein accession	YP_509443
Protein GI	89053992
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR03415] choline ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.183759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG CCGTGTCCTT CCGCGATGTC TGCATCATGT TCGGCCCCCG CCCGGCCCGC 
GCCCTGAGCC TTGCGGATGA AGGCGGCACA AGGTCCGAGA TTCAATCCGC GACGGAGCAT 
GTTCTGGGCG TTCACGATTG TTCGCTGGAT GTGGAGGAGG GGGAGATCCT CGTTCTCATG 
GGCCTGTCTG GCTCCGGCAA ATCCACGCTT TTGCGCGCGG TTAACGGCCT TAACCCTGTG 
GCCCGGGGAC AGGTCGAAGT GCGCGACGGC GATTGGTCCT GCACGCTGCC CGGCGCCTCG 
GTCGCGGACC TGCGTTACCT GCGGCAGAAC TGCGTTTCCA TGGTCTTTCA ACAGTTTGGC 
CTGCTGCCAT GGCGCACAGT GCGCGAGAAT GTCGGCCTTG GGCTGGAGCT TGCGGGGCAA 
TCGGCTACGG CCCGGGCAGA GGCGGTGGAC AAGCAATTGG CGCTCGTGAA CCTCAGCGAA 
TGGGGGGATC GCAAGGTGGG CGAATTGTCT GGCGGCATGC AGCAGCGCGT TGGCCTGGCC 
CGCGCCTTCG TCACCGACGC CCCGATCCTT CTGATGGATG AGCCGTTCTC CGCCCTTGAT 
CCCCTGATCC GTTCCAAACT GCAGGACGAG CTGCTGGACC TCCAGCGCGA CCTGAAACGC 
ACCATCATCT TCGTCAGCCA TGACCTGGAT GAGGCGTTCA AGATCGGCAA CCGCATCGCG 
ATCCTGGAAG GGGGCCGCAT CGTGCAGATC GGCACGCCCC GGCAGATCTT CTCGGAACCC 
GCGACGGGCT ACGTGGCCGA ATTCGTCTCT AACATGAACC CCTTAGGCGT TCTGACCGCA 
CGCGACGTCA TGCAAGACGT GCCCACCGAC GCGCCCCGGA TCCCGGTGGA AATGCCCGTC 
AAAGACATCC TTGCGCGATT TGCGGACACG CCTGCGCCCC TCGCCGTTGA GGAAGACGGA 
GAGGTCATCG GCACCGTAAC GACCGACAGC GTCGCCGCGC GTCTCGGCAC GCCGGAGGCC 
GGGCATTCAA CCTCTCCGGC TTAG

Protein sequence

MSTAVSFRDV CIMFGPRPAR ALSLADEGGT RSEIQSATEH VLGVHDCSLD VEEGEILVLM 
GLSGSGKSTL LRAVNGLNPV ARGQVEVRDG DWSCTLPGAS VADLRYLRQN CVSMVFQQFG 
LLPWRTVREN VGLGLELAGQ SATARAEAVD KQLALVNLSE WGDRKVGELS GGMQQRVGLA 
RAFVTDAPIL LMDEPFSALD PLIRSKLQDE LLDLQRDLKR TIIFVSHDLD EAFKIGNRIA 
ILEGGRIVQI GTPRQIFSEP ATGYVAEFVS NMNPLGVLTA RDVMQDVPTD APRIPVEMPV 
KDILARFADT PAPLAVEEDG EVIGTVTTDS VAARLGTPEA GHSTSPA