Gene Nmag_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1940
Symbol
ID	8824781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	1974098
End bp	1975249
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID
Product	ABC transporter, periplasmic binding protein, thiB subfamily
Protein accession	YP_003480073
Protein GI	289581607
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCGAC GGACGTTCGT CCACGGCGTC GGCGGCGGCT CGGTCACCGC ACTCGCTGGC 
TGTCTGACCC GTAACGGCGA GAACGAAGAA CACGCCGCCG AAACGGGGCC GCTGCGAGTC 
GCGACCTACA CTTCCTTCGC GACCGGCTCA GACTCCGACC CTGATACCGA CTCCGATCCC 
AATCCCGATC CCGATCAAGC CCCCAGCCCC GCCGGTGACT GGTTCCGAGA AACCGTCGAA 
GAAGAGTTCG AGGAGGAGAT CGAGTGGACC GTCCCCGAAT CCGGCATCGA ACACTACATC 
CAGCGCGCCC GTCTCGACGC CGACATCGAC ACCGACGTCA TCCTCGGCCT CACCGCGAGC 
GAACTCGCAC TCGTCGACTC CGTCCTCGAC GCCCACGGCG ACACGCGACT GTTCGAATCG 
CTCGAGCGCG ACCGTCTCGA GCACGCCGAC CGAATCCAGT CCGACCTCGC CTTCGACGAC 
CCGCGCGACC GCGTACTCCC CGTGGGCACC AGCTACCTCT CGCTCGTCTA CGACGAGACG 
GTACTCGAGT CCCCACCCGA GACGTTCGAC GACCTCCTTG ATTCGGCGTA CGCGGACACG 
TTGCTCGCGC AGGATCCGCG TGTGTCAAAT CCGGGGCAGG CGTTTTTCCT ATGGACGGTC 
GCGGAGTACG GGTCCGGCTC TGGCATGCTC TCCTTCTGGG AGGAGTTGCA GGCGAACGGC 
GTTCGCATCG AGGAACGCTG GACGGACGCC TACCGGGATG CCTATCTCGA AGGTGAGCGC 
CCGATGGTGG TCTCGTACTC GACGGATCAG GTGGTTGCGG CCGCGACTGA TCGAGACATG 
CAGCGCCACC AGGTCGCACC GCTTGACAAC GCGGGATATC GGAGTACTGA GGGGGCAGCG 
ATCTTCGCGG ACGCGACGCG GACGGAACTC GCTTACGAGT TCGTCGACCT CCTGTTGTCC 
CAGACGGCAC AGGCGGAGCT CGCGACGCGA AACGCGCAGT TCCCCGCCGT CAGTGACGAG 
TACGTCGACC TCGATGCGAC GTTCCTCGAG AACGCGGTAG AGCCAGACGA GACAGTAACG 
CTCACCTACG ACGACCTTGA GGGAGAGTTC GCGACCTGGC TCGAGACCTG GGACGACGAA 
ATCGGAGATT GA

Protein sequence

MDRRTFVHGV GGGSVTALAG CLTRNGENEE HAAETGPLRV ATYTSFATGS DSDPDTDSDP 
NPDPDQAPSP AGDWFRETVE EEFEEEIEWT VPESGIEHYI QRARLDADID TDVILGLTAS 
ELALVDSVLD AHGDTRLFES LERDRLEHAD RIQSDLAFDD PRDRVLPVGT SYLSLVYDET 
VLESPPETFD DLLDSAYADT LLAQDPRVSN PGQAFFLWTV AEYGSGSGML SFWEELQANG 
VRIEERWTDA YRDAYLEGER PMVVSYSTDQ VVAAATDRDM QRHQVAPLDN AGYRSTEGAA 
IFADATRTEL AYEFVDLLLS QTAQAELATR NAQFPAVSDE YVDLDATFLE NAVEPDETVT 
LTYDDLEGEF ATWLETWDDE IGD