Gene Mhun_3090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mhun_3090
Symbol
ID	3921967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanospirillum hungatei JF-1
Kingdom	Archaea
Replicon accession	NC_007796
Strand	+
Start bp	3366840
End bp	3367820
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	47%
IMG OID	637898700
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_504496
Protein GI	88604318
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID	[TIGR03589] UDP-N-acetylglucosamine 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.196445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.352446
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTCT TCGACAATAA AACCATACTC ATAACCGGCG GAACCGGATC TTTCGGCAAC 
GCGTTCACCT CCCGCCTTCT CAATAACCAT AATCCGCATA GTATCCGGAT CTACTCGCGT 
GGAGAATATC TCCAATGGAA GATGCAGCAA AAGTTTTCCG ACAGCCGCAT CAGGTTTTTC 
ATTGGTGATA TCCGAGATAA AGCCCGTCTC ACTCGCGCCT TGAATGATGT CGATATCGTG 
GTTCACGCAG CAGCGCTTAA ACAGGTTCCA GCATGTGAGT ATAATCCGAT TGAAGCCGTG 
AGAACCAACA TCGACGGGAC AACAAACCTT ATAGATACAT CAATTGACAA CAATGTCGAC 
CGGCTCATAG CCCTGAGCAC TGACAAGGCT GTTCACCCGG TCAATCTCTA CGGCGCAACA 
AAGATGGTAG CGGAGAAACT GTTTATCCAG GGGAATGCAT ATTCAGGTAA GAAAACAACC 
CGGTTTTCCT GTGTCAGGTA TGGAAATGTG GTTGGAAGCA GAGGAAGCAT CGTTCCCTTA 
TTTAAGATGC AAAAAGAAGA GGGAAAGATT ACTATAACTG ATCCCCGTAT GACCAGGTTC 
TGGCTTACCC TGGACCAGGG TGCAGCCTTT GTTGAAAATT GTACCCAGAT TATGAATGGA 
GGAGAGATAT TTGTGCCCAA GATCCCCAGC ATGAAGATCA CCGACCTTGC AGAGGCTATA 
GCTCCTGGTA TTCCCCATGA GTATATCGGC ATCAGACCTG GAGAAAAGAT CCATGAAGTT 
CTTATTACCG AAGATGAAGC CCGCCATACC CGCGATCTTA AAGAATACTA TATTATAGAT 
CCGGAGATAT CGTTCTGGAA CGGGCATAGA AAGGATTATT CTTACACACT CCCTGAAGGG 
TTCCGGTATT CCAGCGAGAC CAATACCGAA TGGCTGGATG AAGAGGGATT AAAGCAGATG 
CTTGCTGAAT CCCACCCATA A

Protein sequence

MSFFDNKTIL ITGGTGSFGN AFTSRLLNNH NPHSIRIYSR GEYLQWKMQQ KFSDSRIRFF 
IGDIRDKARL TRALNDVDIV VHAAALKQVP ACEYNPIEAV RTNIDGTTNL IDTSIDNNVD 
RLIALSTDKA VHPVNLYGAT KMVAEKLFIQ GNAYSGKKTT RFSCVRYGNV VGSRGSIVPL 
FKMQKEEGKI TITDPRMTRF WLTLDQGAAF VENCTQIMNG GEIFVPKIPS MKITDLAEAI 
APGIPHEYIG IRPGEKIHEV LITEDEARHT RDLKEYYIID PEISFWNGHR KDYSYTLPEG 
FRYSSETNTE WLDEEGLKQM LAESHP