Gene Msed_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0444
Symbol
ID	5105440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	398865
End bp	400277
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	47%
IMG OID	640506350
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001190545
Protein GI	146303229
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGG TATTGAGAGA CCTGCTAAGC AGGAAAACTT TCATTTTCTC GGTAGTCGTA 
ATCCTTTTCT TTGCTGCTAT TGCCCTTTTA GCTCCAGTTC TAACGTCATA CAACAATCCT 
TATCTAGTTT CACAACAGTT CGTTGCGGCC CCCTACGCTG TTCCTTCGTG GGCCACAATC 
TTCCCTCAAT ATCATGGTCT TCCCCCTGAC GTTAGAATGA CGTTGTCTCC CTCTGAGACC 
TCAGGACTTA CCCCCATTAA CTCGTCCATG GTTAAGGTGG AGGTTCCTGC AGGGGGTCAG 
GTTAATCTGA CTTACGCCAT TAGATGGAAT TGGAGTTCTC CATACAACGT ACTTCTGTCC 
TTTACCCTAG TTACGCCATC TACAAGCGAC TTTAACGTAA ATCTTTACAT GAACAATATC 
AACTTCATGG AACTGTCACC TTTACCGATA CCTCCTGCAG TTAGCGTTAC TCCCGGGAAG 
GCCAATTACG TTACCTTCTC TTCAGAAACT ATAAACCCAA GCAATTCTCC GTACGTAAGC 
TCCCTTCCCT TCCAAGATCA GCCCTTAGCA TCACTTGAGT TCCCCAAGGC TGTACTGCCT 
AAACCTGGGA TATATTACCT GATTATATCA TTCCAGAATA CAGGAAATTC ACCTGAGACT 
TTCCTTGTTT CCAACCCACA TTACTCCTCT CTTGGTTACG CTTATGGTAG GTTGGGAACA 
GATGATAATG GCGCGAGCGT GTTCTCGGAG TTCGTGTATG GAGCGAGGTT CGATCTCTAT 
TTAGCCCTTG TAGCCTCAGC CCTTATTATA GGAATAGGAC TCATAATTGG GCTGATAGCG 
GGCTACGTGG GCGGTTTCAC GGATCTGGCC CTGAATGCTC TTACAGACTT CTTTCTGTTA 
ATACCGGGTT TACCTCTCTT GATTGTTTTG ATCTCTATCT TCGATCTCAC TGGGGTCATA 
GTTAACGTGA ACAAGGCCGT CCTTATACTA CTCATCATCT CGTTGTTATC ATGGCCTGGG 
ACTGCTAAGA TAATTAGGGG ACAGACACTA AGCCTCAGGA ACAGAACCTT CGTGGAAGCT 
TCTAGGGCTC TGGGCGAGGG AAGGTTTAGG ATCCTGTTCA GACATATAGT TCCCAACCTG 
ATGGGAATTC TATTTGCTCA ACTGGCATAT GACGTTCCAG GCGTTATCCT GGCTGAGTCG 
GGTCTCGACT TCCTGGGCCT GGGAATTACA GAGTTCCCGA CCTGGGGAAA CATGCTTGGA 
TTTGCCACCA ATGATTTGTC CTTTGCCAAT GGGTTTGCAT GGTGGTGGGT GCTTCCACCT 
GGAATTGGGA TAATATTGTT AAGTACAGCG TTCTACTATT TCGGGACAGC AATGCTTGAC 
GTCCTTAGTC CCTACAAGCT TAGGGGTGAA TGA

Protein sequence

MNKVLRDLLS RKTFIFSVVV ILFFAAIALL APVLTSYNNP YLVSQQFVAA PYAVPSWATI 
FPQYHGLPPD VRMTLSPSET SGLTPINSSM VKVEVPAGGQ VNLTYAIRWN WSSPYNVLLS 
FTLVTPSTSD FNVNLYMNNI NFMELSPLPI PPAVSVTPGK ANYVTFSSET INPSNSPYVS 
SLPFQDQPLA SLEFPKAVLP KPGIYYLIIS FQNTGNSPET FLVSNPHYSS LGYAYGRLGT 
DDNGASVFSE FVYGARFDLY LALVASALII GIGLIIGLIA GYVGGFTDLA LNALTDFFLL 
IPGLPLLIVL ISIFDLTGVI VNVNKAVLIL LIISLLSWPG TAKIIRGQTL SLRNRTFVEA 
SRALGEGRFR ILFRHIVPNL MGILFAQLAY DVPGVILAES GLDFLGLGIT EFPTWGNMLG 
FATNDLSFAN GFAWWWVLPP GIGIILLSTA FYYFGTAMLD VLSPYKLRGE