Gene Noc_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1559
Symbol
ID	3705817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1732474
End bp	1733838
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	52%
IMG OID	637738042
Product	major facilitator transporter
Protein accession	YP_343571
Protein GI	77165046
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.956191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACTG AGGCTACTGC AGACACGACT GAAGCTCATA TCGTTGACGA ATCGGAGGTT 
AAACGCGCCG TCACCGCAGC CGCCATGGGT AATGCGTTGG AATGGTTCGA TTTTAGCATC 
TACAGCTACA CCGCAGCCAC AATAGGGCAT GTGTTCTTTC CCTCTCACAG TAATACCGCC 
TCTCTGTTAG CATCCTTCGG TGTGTTCACC CTTGCCTTTG TAGTAAGACC CCTGGGAGGC 
TTTTTCTTCG GCCCTTTGGG AGACAAGGTA GGCCGCAACA AAGTGCTGGC ACTAACTATC 
ATCTTGATGT CGGTCGCCAC CTTTTGTATT GGGATCATTC CAAGTTACGC GTCGATCGGC 
GTTTGGGCGC CCATTGGCCT AATCCTGGCG AGATTGGTGC AGGGCTTCTC TACCGGCGGT 
GAATACGGCG GTGCCGCCAC ATTTATTTGT GAATTCTCGC CTGATAACCG GCGTGGCTTT 
TTGGGAAGTT GGTTGGAGTT CGGCACGCTA GGCGGCTACA CGCTAGGCGC CGTTCTAGTT 
ACCGGCATCT CGATGGTGCT TACCAGTGAA GAATTTTTCA CCTGGGGCTG GCGTATCCCC 
TTTCTGATAG CGGGTCCCTT AGGGCTACTC GGACTCTACC TGCGCCTGAA ACTCAAAGAA 
AGCCCGGCAT TTAAACAGAT GAAGGAAGAT GCGGAGCAAA AGGATTCCTC CTTTCGGGAA 
ATTCTTATCG TTAATCTACG TCTACAGGCG CTCTGCATCG GCTTGGTACT GATACTCAAC 
ATCGCCTACT ATACGGTGCT CAGTTACCTG CCAAGCTACC TCACCGAGGT ACTGCATATA 
GATGCCTCCC GCTCACTGGT ATTTCTCGTG CTGACGATGT TAGCCATGAT GTGCGTCATC 
AATATGGTGG GCAAACTATC AGACCACGTG GGGCGTAAAC CGGTGCTGGT AGGCGCTTGT 
ATCGGCTTTA TCATTTTGTC ATACCCAGCA TTTTGGTTAC TGTCACAACA CAGTATCACC 
ACCACCGTCA TCGGTTTGGC CATTCTAGGC ACACTTGTGG TAGCGCTTGC GGGTGTCATG 
CCGGCTACTT TACCTGCTAT TTTCCCAACC CACATCCGGT ACGGCGGCTT TGCCATTTCC 
TACAATATTT CCACCGCTCT GTTTGGCGGC ACTGCCCCCT TGGTTATTAC CTGGTTGATC 
GCGACCACCG GTGATAACTT TGTGCCTGCC TACTATCTGA TGCTGGCAGC AGCTATCGCC 
ATAGTACCCA TTCTAATCAT TCCCGAAACC GCCGGTAAAC CGATGCTAGG CTCGATGGCG 
GTACGCATCC AGATGAACGA TTCAGGCCCG AAAGCACGGA ACTGA

Protein sequence

MDTEATADTT EAHIVDESEV KRAVTAAAMG NALEWFDFSI YSYTAATIGH VFFPSHSNTA 
SLLASFGVFT LAFVVRPLGG FFFGPLGDKV GRNKVLALTI ILMSVATFCI GIIPSYASIG 
VWAPIGLILA RLVQGFSTGG EYGGAATFIC EFSPDNRRGF LGSWLEFGTL GGYTLGAVLV 
TGISMVLTSE EFFTWGWRIP FLIAGPLGLL GLYLRLKLKE SPAFKQMKED AEQKDSSFRE 
ILIVNLRLQA LCIGLVLILN IAYYTVLSYL PSYLTEVLHI DASRSLVFLV LTMLAMMCVI 
NMVGKLSDHV GRKPVLVGAC IGFIILSYPA FWLLSQHSIT TTVIGLAILG TLVVALAGVM 
PATLPAIFPT HIRYGGFAIS YNISTALFGG TAPLVITWLI ATTGDNFVPA YYLMLAAAIA 
IVPILIIPET AGKPMLGSMA VRIQMNDSGP KARN