Gene Noc_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1547
Symbol
ID	3705805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1716918
End bp	1718261
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	51%
IMG OID	637738032
Product	major facilitator transporter
Protein accession	YP_343561
Protein GI	77165036
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCATG AGCTACAATC TATTTCTTCA TTGCTTTTTG GTATTGCCAT TGTACTATTG 
GGTTCGGGCC TATTAGGCAC CTTAGTGGGG GTGCAAGCCA ATCAGGAGCA ATTCAGTTCC 
ACGGTTATTG GTTTTATCCA ATCTGCCTTT TTTCTGGGCT ATGTGCTAGG AACCTTCCTT 
TGTCCCCTTC TAATCAAGCG CGTAGGGCAT ATCCGCGTTT TTGCCACCAT GGCCGCGTTA 
GGGTCGGCAA CAGCGATGGG CTTTGCACTT TGGGTCCATC CTCTCTGGTG GGTTCTATTG 
CGGATGGTTT TGGGAATTTC GGTAGTAGGG CTTTATATGG TGGTTGAAAG CTGGCTCAAT 
GAGCAGTCTT CCCACCATAG CCGGGGCCGG GTGTTCGCCA TTTACATGAG CATTACGTTG 
ATGGCCTTGG GGTTTAGTCA GTTTCTTCTT TTAATAGAGG ATAATCATGG CTTTATCCGT 
TTTGCCTTGA CCGCCGTGTT GTTTTCCCTA GCCCTGATTC CGGTTGCGTT GACCCAGACG 
CTGGAACCAA AACCGATCTC CGCGCCACGC TCGAATCTTA AAGAACTTTA TTTAGTCTCG 
CCCCTAGGGG TTGTGGGAGC TTTGGTGGCC GGCCTTGCCA GTGGCGCCTT TTGGGGGATG 
GGAGCAGTGT TTGCCCAGAA TATTGGTCTC TCGGTCTCCA GTACCTCCGT GTTTATGAGC 
ACAGTTATCT TTGGAGGCGC CCTGCTACTA TGGCCGGTGG GCTATTTATC GGATCGTTGG 
GATCGGCGCA GAGTGCTCAT CATGGTTAGC TTTACCAGTG TGGCTAGCGT GTTGGGCGCC 
GCCCTTGTTT TAGATGCTTC AACGCCGATG CTGCTGTTGC TTGCCTTTCT TTACGGGGGG 
GTTTCTTTTT CCGTTTATGC CCTGGCCGTG GCTCACTTAA ACGATCACCT TAAGCCTGGG 
GAAGTACTAG AAGCGACTCG GGGGATTCTG TTAGTTTATG GGGCTGGTTC CGCTCTGGGG 
CCCTTGATTG CTGGTTTTTG CATGGCGGTT TGGGGTCCCT CCGGTTTACT AGACTATTTA 
GCGGCTATTT TGGCGTTGCT CGGGCTGTTT GGCCTTTACC GCACCCAGCG GAGTGCTCCC 
ATACCGGCTG AAGAACAGGG GGAATTCGTT CCCATGATAC GAACTTCTCA AGCTGTCCTT 
GAAATGTATC CAGAGGCCGA TCTGGAGCCA GAATTGGACT TAGCGTTGAG TACTGATTTT 
GAGGAAGAAG CAGAGCCTGA ATCCCCGCCG GATTCTTTTA GCATGGACTG GGACTCTCCG 
GATTATGAGC AAGAGAGAAA ATAG

Protein sequence

MQHELQSISS LLFGIAIVLL GSGLLGTLVG VQANQEQFSS TVIGFIQSAF FLGYVLGTFL 
CPLLIKRVGH IRVFATMAAL GSATAMGFAL WVHPLWWVLL RMVLGISVVG LYMVVESWLN 
EQSSHHSRGR VFAIYMSITL MALGFSQFLL LIEDNHGFIR FALTAVLFSL ALIPVALTQT 
LEPKPISAPR SNLKELYLVS PLGVVGALVA GLASGAFWGM GAVFAQNIGL SVSSTSVFMS 
TVIFGGALLL WPVGYLSDRW DRRRVLIMVS FTSVASVLGA ALVLDASTPM LLLLAFLYGG 
VSFSVYALAV AHLNDHLKPG EVLEATRGIL LVYGAGSALG PLIAGFCMAV WGPSGLLDYL 
AAILALLGLF GLYRTQRSAP IPAEEQGEFV PMIRTSQAVL EMYPEADLEP ELDLALSTDF 
EEEAEPESPP DSFSMDWDSP DYEQERK