Gene Hlac_3531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3531
Symbol
ID	7402374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	278114
End bp	279313
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	58%
IMG OID	643710069
Product	major facilitator superfamily MFS_1
Protein accession	YP_002567635
Protein GI	222481399
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGCCA GCGATAGACA GATAACCAGT TTCACGACGC TCGGTCACGC ACTGTTTCAC 
ACGTACGAGT TGTCGATTCC GCTCTTCATC GGGCTGTGGA TAACCGAATT CGGTCTCTCT 
GCAGCACTGA CCGGCCTCGT AGTTGGGGCA GGATACGCGC TTATTGGAAT TGGAGCACCA 
GTCAGTGGCG TCCTCTCAGA TTATTTCGGG TCTCGGCGGC TGATACTTCT ATCCGTGCTC 
GGAATGGGTG GTGGCTTCGC CCTGCTTGGA GCAGCACAGG GGCCCCTGTC GCTGGCAGCC 
TGTGTCGTAC TCTGGGGAGC ATTTGCAAGT TTGTACCATC CTGCAGGACT CTCGTTGATT 
AGCCGGGGGG CCTCCGAACG AGGAACGGTG TTTGCCTATC ACGGTGCTGG CGGCAATATC 
GGGACGGCAG CTGGACCGCT CTGTACAGCT CTCCTGCTAT CGGTGTTTCA CTGGCGCATA 
GCGGCGGTAG TTCTATTCGT CCCAGCGGCT GTCGCCGCCT TCGTCGGAAT GCGGATCTCG 
TTCGACGATA TCAAATCGAA GGACGGCGAT AACCCGGACT CGATGCGAGG TGCGTTCACA 
GAGACACTTG TCGATTCACG TCGGCTGTTC ACAGTCGGAT TCAGCATCGC ATTCATCACT 
GTACTGCTGT ACGGAACCTA CTACCGTGGT CTCCTGACGT TCTTGCCGGA CATACTGGGT 
AATTCCTCGC TGGACGACCT GACAATTCTG AGCTACTCGT TGGGACCCGC GGAGTATATC 
TACACCAGCA TGTTGACCTT CGGAATCGCG GGACAGTACG CCGGCGGAAA ACTCACCGAC 
CGTATCCCGA GTCGGACGGC GTTTCTCGGT GCGTTGAGTT CGCTCGTTGT GCTTGCCCTC 
CTCTTTATTC TCGTCCAAGG ACAGGGCTTC GTGCCGCTGG TTCTGGTCAG TCTGGCGCTC 
GGATTTTTCG TCTACGCGAC GGCACCCATC TATCAGGTCG TCATCGCCGA GCACGTTCCG 
AGCGAGAGTC ACGGCCTCTC CTATGGCTTC ACCTACCTGG CCATGTTCGG CATCGGGGCC 
CTCGGGGCAA CGATTGCCGG CACGCTGCTG ACGTACGCGA CGACAACGAT ACTGTTCGTC 
GCACTGGCTA TGCTGGCGGC GACCGGATGT CTCTGCCTCC TTGTCCTCCG GTGGCTCTGA

Protein sequence

MQASDRQITS FTTLGHALFH TYELSIPLFI GLWITEFGLS AALTGLVVGA GYALIGIGAP 
VSGVLSDYFG SRRLILLSVL GMGGGFALLG AAQGPLSLAA CVVLWGAFAS LYHPAGLSLI 
SRGASERGTV FAYHGAGGNI GTAAGPLCTA LLLSVFHWRI AAVVLFVPAA VAAFVGMRIS 
FDDIKSKDGD NPDSMRGAFT ETLVDSRRLF TVGFSIAFIT VLLYGTYYRG LLTFLPDILG 
NSSLDDLTIL SYSLGPAEYI YTSMLTFGIA GQYAGGKLTD RIPSRTAFLG ALSSLVVLAL 
LFILVQGQGF VPLVLVSLAL GFFVYATAPI YQVVIAEHVP SESHGLSYGF TYLAMFGIGA 
LGATIAGTLL TYATTTILFV ALAMLAATGC LCLLVLRWL