Gene PCC7424_2831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC7424_2831
Symbol
ID	7110634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7424
Kingdom	Bacteria
Replicon accession	NC_011729
Strand	-
Start bp	3143962
End bp	3145422
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	44%
IMG OID	643481077
Product	major facilitator superfamily MFS_1
Protein accession	YP_002378106
Protein GI	218439777
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.0218624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTTAT CTCAATCTCA AGAAAAATCC TCTCATTCTC AGAAAATCGC TCATGATAAT 
CAGGATCTAG CCAAATCTAA TCCTAACCCC AGTAAACCTT TATCTTCCAA TAAGTCCCCC 
TCAACAGAAG GATTAGGGGC AGTTTTAACT AATCCTCGAT TTGTGGTTTT ATGGACCGGA 
CAAATTTTTT CTCAACTGGC GGATAAAATT TATCTGGTGC TAATGATCGC CCTCATTACC 
AGTCATTTTC AAGCCCCAGA TCAGCCCATT AGTGGATGGG TATCGGCGAT TATGATCGCT 
TTTACCATTC CGGCGGTCTT ATTTGGCTCT TTAGCCGGGG TTTATGTGGA TCGCTGGTCA 
AAAAAAGGCG TTTTAGTGAT TTCTAATTTG CTGCGAGGGG CATTAGTTTT AATTATTCCT 
CCTTTATTGT GGTTATCGGC TCACGAAGCG ATCGCTATTC CCGTCTCTTG GCTACCGGAA 
GGGGCACGAC AATGGCAAGG AGAAGCCCAA AGCGTCTTTT ATCTGCCGGT AGGGTTTTTA 
ATGCTCTTAG TGCTAACCTT TCTTGATTCT ACCCTAACTC AATTCTTTGC TCCGGCTGAA 
CAAGCCATCA TTCCCTTAAT CGTCAAACGT CGTCGCTTAC TCTCGGCCAA TTCTTTGTTT 
ACCACCACGA TGATGGCCAC GTTAATCATC GGATTTGCCA TTGGAGAACC CCTATTACAA 
TCGGTATCCC ATTTCGTGGG GTTGATGGGG TTTTCTGAAG ATGTGGGGAA AGCTTTAGTC 
GTTGGGGGAT CTTATACCTT TGCCGGGTTA ATGCTATTTT TGCTCAGAAC GAAAGAAAAA 
TCAGACATTC CTTCTCACGC AAGACCTCAC GTTTTAGAAG ATATTCGAGA TGGTATTGCT 
TATCTTCAAA AAAATCATCG GGTGAGAAAT GCCCTCATTC AACTGATTAT TTTATTTTCT 
GTGTTTGCCG CTTTATCAGT CTTAGCGGTA CGATTAGCAG AAACCATTCC GGGCATGAAA 
GCCGAACAAT TTGGCATTCT CTTGGCAGTA GGAGGTCTGG GGTTAGCTTG TGGGGCGGGT 
ATTGTCGGCA ATTGGGGACA ACGGTTTTCC CATACTCAAT TAAGTATATG GGGGTCGGTG 
GGCATGGCCA TATCCTTAGT AGGATTATCG TTTTCCGAGG AGCATCTCTG GTGGGCACTC 
TCTAGCACCG TTTTTTTGGG CTTTTTTGGC GCTTTAGTGG GCGTTCCCAT GCAGACCACC 
ATTCAAGCAG AAACACCGGC TGATATGCGG GGGAAAGTCT TTGGGTTACA AAATAACGCG 
GTCAATATTG CTCTGTCTTT ACCGTTAGCT TTGGTCGGTA TTGCGGAAAC TCTACTCGGA 
TTACAAACTG TCTTAATAGG GTTAGCTGTT CTTTCATTAC TCGGAGGAGT ATTAACGGGT 
TATATCTCTC GCTTAAGTTA G

Protein sequence

MQLSQSQEKS SHSQKIAHDN QDLAKSNPNP SKPLSSNKSP STEGLGAVLT NPRFVVLWTG 
QIFSQLADKI YLVLMIALIT SHFQAPDQPI SGWVSAIMIA FTIPAVLFGS LAGVYVDRWS 
KKGVLVISNL LRGALVLIIP PLLWLSAHEA IAIPVSWLPE GARQWQGEAQ SVFYLPVGFL 
MLLVLTFLDS TLTQFFAPAE QAIIPLIVKR RRLLSANSLF TTTMMATLII GFAIGEPLLQ 
SVSHFVGLMG FSEDVGKALV VGGSYTFAGL MLFLLRTKEK SDIPSHARPH VLEDIRDGIA 
YLQKNHRVRN ALIQLIILFS VFAALSVLAV RLAETIPGMK AEQFGILLAV GGLGLACGAG 
IVGNWGQRFS HTQLSIWGSV GMAISLVGLS FSEEHLWWAL SSTVFLGFFG ALVGVPMQTT 
IQAETPADMR GKVFGLQNNA VNIALSLPLA LVGIAETLLG LQTVLIGLAV LSLLGGVLTG 
YISRLS