Gene Ava_3741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3741
Symbol
ID	3678984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	4655609
End bp	4657201
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	47%
IMG OID	637719091
Product	twin-arginine translocation pathway signal
Protein accession	YP_324241
Protein GI	75909945
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3540] Phosphodiesterase/alkaline phosphatase D
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.803365
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.190808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCGTG TTCATTTACA TCGCTTGCTG TCCTCCCAAG CAAAGCGGCG ACGTTTTCTG 
CTCGGTGCTG GAACATTGAC TGCAAGTGCC ATAGCCAGTC TTTGGACTCA TAAAGTTGCC 
GCCAAGTCAA GATTCTCAGC CTATCCCTTC AGCCTTGGTG TTGCTTCTGG TGATCCTTTA 
CCAGATAGCG TAATTTTATG GACAAGGCTA GCTCCAGATC CTTTAAATGG TGGTGGAATG 
CCGCCCGTAA ACGTACCAGT ACGGTGGCAA ATTGCTACGG ATGAAAATAT GAGAAAAGTT 
GTGCTACGGG GCGTGACATT GGCAACCCCC GAATTAGCGC ATTCTGTCCA TGTCAATGTG 
CGTGGCTTAC AGCCTGACCG TTGGTACTGG TATCAGTTTA CAGTGGGTAG TGAAGATAGC 
CCCATTGGTC GTACCCGCAC TGCTCCAGCA ATTGGCTCTA GGTTGAATCA GCTCAACTTT 
GCGTTTGTTA CTTGCCAAAA ATGGGAGGAT GGTTACTATT CTGCTTATCG TCGCCTAGCA 
GAAGAAGATT TAGATTTGGT TTTTCACTTG GGTGACTATA TTTACGAATA CGGCATCTCT 
GCCAACGGCG GTGTGCGTAA TGTATCTTTA CCCAGTGAAT TTAGAAAAGA AACCAATACG 
CTAGAGCAAT ACCGCCTGCG ATATGCTCTC TATAAAACTG ACCCGGATTT ACAAAAAGCT 
CACGCCTTAT TTCCCTTTTC AGTCACCTGG GACGACCACG AAGTTGAGAA TGACTACACT 
GATAACCTTT CGGAAAACAA CGATCCAGTG GCCAAGTTTT TGCAAAGGCG TGCAGCTGCT 
TACCAGGCTT ATTATGAGCA TATGCCACTG CGGGAATTTT CCATACCACA GGGCCCCGAT 
ATGCCGATTT ACCGTCGTTT GACCTTTGGT AATCTAGCTG AGTTTAGCGT CCTTGATACC 
CGCCAGTACA GGAGTGATCA GCCATGTACT GATGGTGAAA CACCCCGTTG CCCAGCAGCG 
CTAGATCCTG CAAAAACTAT GCTCGGTACT CAGCAGGAAC GTTGGTTGCT GGATGGTCTT 
GACCGTTCTC AAGCACGTTG GAACATACTT GCTCAACAGG TGTTGATGGC AGAGCTAGAT 
CATAAAATTG GGTCAGGTGA AATTTTTTGG AACGACTCGT GGGATGGATA CCCTCTCGCA 
CGTAACCGTG TTTTAAATCA CATCGCTGAC CGTAGAATTT CTAATCCAGT GGTGATTACT 
GGGGATTGGC ACTCCATATT TGCCAATGAC CTCAAGCTGG ACTTTAAGGC TACTAACTCT 
CCTACAGTAG CTACGGAATT TGTGACTCCG TCAATTTCTA GCAATGGTGA TCGGAATGTT 
TACGGCCCCT ACTACGGCCC GATGATTCCA GAAAACCCAC ACATCAAATT TTTTGACGGC 
GATCGCCGGG GCTATTTCCG AGTTAATCTT AACTATGATC GCTGGCAAAC TGATCTGCGT 
ATCGTCACGA CTGTGAGTCG TCCAGATGCA CCTGTATACA CTTTTGCTTC GTTTGTTGTT 
GAGAATGGTC GCCCAGGTGT TCAACGTGCA TAA

Protein sequence

MERVHLHRLL SSQAKRRRFL LGAGTLTASA IASLWTHKVA AKSRFSAYPF SLGVASGDPL 
PDSVILWTRL APDPLNGGGM PPVNVPVRWQ IATDENMRKV VLRGVTLATP ELAHSVHVNV 
RGLQPDRWYW YQFTVGSEDS PIGRTRTAPA IGSRLNQLNF AFVTCQKWED GYYSAYRRLA 
EEDLDLVFHL GDYIYEYGIS ANGGVRNVSL PSEFRKETNT LEQYRLRYAL YKTDPDLQKA 
HALFPFSVTW DDHEVENDYT DNLSENNDPV AKFLQRRAAA YQAYYEHMPL REFSIPQGPD 
MPIYRRLTFG NLAEFSVLDT RQYRSDQPCT DGETPRCPAA LDPAKTMLGT QQERWLLDGL 
DRSQARWNIL AQQVLMAELD HKIGSGEIFW NDSWDGYPLA RNRVLNHIAD RRISNPVVIT 
GDWHSIFAND LKLDFKATNS PTVATEFVTP SISSNGDRNV YGPYYGPMIP ENPHIKFFDG 
DRRGYFRVNL NYDRWQTDLR IVTTVSRPDA PVYTFASFVV ENGRPGVQRA