Gene Nmag_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2006
Symbol
ID	8824848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	2044653
End bp	2045768
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	58%
IMG OID
Product	ABC-3 protein
Protein accession	YP_003480139
Protein GI	289581673
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.522018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCTG ACGAAAACGG GCCCATTGCT GCCGGTGAAC CGGCCGAATG GAGTCGCAGT 
CGTTTCGAAC AGTGGAGCGG CTACTCACTG CGCAAGCTGA TCGAACTGGT CGGTGCGGTT 
GTCACGATTG GCCTCGCCGT CGCCATGCTC GGATTCATCA CGCTCGATTG GCTTCGGTTC 
GCACCGGAGT GGGCAGTCAT TGGCTCCTAC GCGGAGTTGT TGCTTGGGCT GTTCCTGACT 
GGCGGAGCGT GGCTGGATAC GTCCCTGGGA ACGAACGTGT TCCAGTACTT CTTCACGTGG 
CGGGTAATCG CAACGGGTGT CCTCGTCGGG ATCGCTGCGC CACTCATCGG AACGTTTCTG 
ATCCATCGAC AGATGGCCCT TATCGGCGAA ACGCTCGCAC ACACAGCGTT TACCGGTGTT 
GCTATCGGAG TACTACTCGT CGCTGTTACC GGCTGGACTG GATCTCTCTT GTTCGTCGCA 
CTTATCGTGA GTGTACTCGG TGCGCTTGTA CTCCAGTGGT TGACCGAACA CACCGCGGCC 
TATGGCGACG TCCCCATCGC AATCGTCCTC AGCGGGAGTT TCGCAATCGG AACACTGCTC 
GTCAGTTGGA GCCGAGATTT CGCTTCGGTG TCGCTCAATA TCGAGGGGTT CCTCTTTGGC 
AGCCTCGCAA TTATCACTGC CGAAGGCACG CGGATGGTCG CCATACTCAC CGTTGCCGTC 
GTTGCCGTTG TCGCGGTCAC CTACAAGCAA CTGCTGTTCA TCACGTTCGA CGAGCAGGCT 
GCCCGCGTTG CGCGGCTCAA CGTCGACCGT TACAACACGC TGCTAATTGG GATGGCTGCA 
GTCATCGTCG TCGGTGCGAT GCAAATCCTC GGTGTTATTC TCGTTGCGGC GATGCTCGTT 
ATCCCGGTCG CAACGGCCTC ACAGATTGCC AACAGCTTCC GGGAAACGTT ATTGCTCTCT 
GTCCTGTTTG GACAGGGTGC AGTTCTCGGC GGGCTAGCGT TTTCGATCAG AACGAACCTC 
CCGCCTGGCG GTTCAATTGT CGTCGCCGGA ATCGTCTTTT ACGGGCTTAC TATCGTCCTC 
TCAGACCGAT CCGCGGTTGC AATCTCTACA CACTAA

Protein sequence

MSADENGPIA AGEPAEWSRS RFEQWSGYSL RKLIELVGAV VTIGLAVAML GFITLDWLRF 
APEWAVIGSY AELLLGLFLT GGAWLDTSLG TNVFQYFFTW RVIATGVLVG IAAPLIGTFL 
IHRQMALIGE TLAHTAFTGV AIGVLLVAVT GWTGSLLFVA LIVSVLGALV LQWLTEHTAA 
YGDVPIAIVL SGSFAIGTLL VSWSRDFASV SLNIEGFLFG SLAIITAEGT RMVAILTVAV 
VAVVAVTYKQ LLFITFDEQA ARVARLNVDR YNTLLIGMAA VIVVGAMQIL GVILVAAMLV 
IPVATASQIA NSFRETLLLS VLFGQGAVLG GLAFSIRTNL PPGGSIVVAG IVFYGLTIVL 
SDRSAVAIST H