Gene Aazo_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1968
Symbol
ID	9339761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2048836
End bp	2050059
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	39%
IMG OID
Product	Type II secretion system F domain-containing protein
Protein accession	YP_003721169
Protein GI	298490992
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTACCT ACCTTGCTCG TATTCGCGAC TCTCAAGGAA ATTTACGAAC TCAGAAATTT 
GTCGCTGATT CCCTAAGGGA TGCTCGGACT AATCTCAGAG ATAAGGGCTT TATAGTTCAA 
GACCTGAAAG AATCTCAAAG TTTATCTTCC CGCTTTGATT TAAAAAAATT CCAGAATTCC 
TTAGTTAAGG TTTCTGTAAA AGACAAAGCT GTTTTTTCCC GTCAGTTTGC TGCTTTAGTG 
AATGCAGGTG TAGCAATTGT TAGAGGACTC GCAATACTTG GGGAACAGTG CAATAATCCC 
AAATTGAAAC AAGCTCTTAT TGAAATTGGC GGTGATGTGC AAACGGGAGT TAATCTTTCT 
GATTCTATGG GTAAGCATCC TGACTGTTTT GATGGTTTGT ATGTGAGTAT GGTTCAGTCC 
GGAGAAATAG GTGGTGTGCT AGATGAAGTA TTAAATCGTC TAGCCAAACT ATTAGAAGAT 
ATGGCTCGAT TACAGAACCA AATTAAATCG GCTATGTCTT ATCCATTAGT AGTGGGTTTT 
ATCGCAACTG CTATCTTTGT AGGTATGACT GTGTTTCTAA TTCCCATCTT TGCTAATATT 
TTCAAAGACA TAGGTATTGA ATTACCAGCA CTAACACAAT TTCTGATGAC TTGTAGCGAA 
ATATTACGAA GTTATTGGTC TTTAGTAATT ATCGCTGGTT TTATGGCAGC TTCCTTTACC 
TGTAAGCAGT ATTACAAAAC TCCCGTAGGT AGAGAAACTA TTGACCGCCT ATCTTTAAAA 
GTACCTTTGT TTGGTGACTT GATCCAAAAA TCTTCAGTTG CTCGATTTAG CCGCACCTTT 
GGGGCTTTAA CTCGTTCAGG TGTACCAATT CTAACTTGCT TAGAAATTGT GCGGGATACA 
TCAGGAAATC AAGTGATTGC TAATGCCATA GATGCAGCTA GGCTAGATGT TCAACAAGGT 
GGGATGATTA GTGCCGCTTT GAAAAAAGAT GCAGTTTTTC CATCTATGGC TATTGCCATG 
ATGAGTATTG GTGAAGAAAC TGGTCAATTA GATGGAATGT TGATGAAGGT TGCTGATTTC 
TATGAAGATG AAGTAGAACA GGCAGTTAAA TCATTAACAA GTATTTTAGA ACCATTAATG 
ATTGTGGTTC TTGGGGGGAT GGTTGGTACA ATTTTGCTGG CAATGTACTT ACCCATGTTC 
AAGGTCTTTG AAAAACTGGG GTAA

Protein sequence

MPTYLARIRD SQGNLRTQKF VADSLRDART NLRDKGFIVQ DLKESQSLSS RFDLKKFQNS 
LVKVSVKDKA VFSRQFAALV NAGVAIVRGL AILGEQCNNP KLKQALIEIG GDVQTGVNLS 
DSMGKHPDCF DGLYVSMVQS GEIGGVLDEV LNRLAKLLED MARLQNQIKS AMSYPLVVGF 
IATAIFVGMT VFLIPIFANI FKDIGIELPA LTQFLMTCSE ILRSYWSLVI IAGFMAASFT 
CKQYYKTPVG RETIDRLSLK VPLFGDLIQK SSVARFSRTF GALTRSGVPI LTCLEIVRDT 
SGNQVIANAI DAARLDVQQG GMISAALKKD AVFPSMAIAM MSIGEETGQL DGMLMKVADF 
YEDEVEQAVK SLTSILEPLM IVVLGGMVGT ILLAMYLPMF KVFEKLG