Gene Tery_3533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3533
Symbol
ID	4244359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5445853
End bp	5446965
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	41%
IMG OID	638108505
Product	biotin synthase
Protein accession	YP_723094
Protein GI	113477033
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCCG TGCTCAAAAC ACCTTTATCA AATCATATAA AAGCAAATAC TAAAGCTTTA 
TTCTCATCTT TGCCAAAGAC AAAAAATGAG TTGGAGATAT CCCTTGATGA TTTGGCTAAA 
CAAATTATTT CTGGGTATCG CCTCAGTCGA GAAGAGGCAA TTATACTGAC TCAAATAGCA 
GGAGAAGAGG ATATTCTTCT TCTGTGTGAA GCTGCTGATC GGGTTCGTCA AGCTTGCTGT 
GGAAATGTTG TAGACCTGTG TAGCATTATT AATGTTAAGT CTGGAGGCTG TTCAGAAAAT 
TGTAGTTTCT GTTCCCAGTC AGTTCATCAT CCTGGAGAAG ATTCTCCTAT TTATGGCCTT 
AAGTCTACTG AAGAAATCTT AGATCAAGCT AAGGCAGCAG AAGCTGCTGG AGCTAAAAGA 
TTTTGCTTGG TGTCTCAGGG TCGGGGTGTT AAGTATAATA GTCCTAAGTC TACAGAATTT 
GAACAAATTC TGGGGACAGT AAGACAAATT CTGGCTGAAA CTAATATTAA GCCTTGTTGT 
GCTTTGGGAG AGCTGACCCC AGAACAAGCT CAAGCATTGG CCGAAGCAGG AGTGACTCGC 
TACAATCATA ATTTGGAAGC TTCTGAGCAT TTTTACCCGG AAATTGTAAG TACTCATAGC 
TGGAATGACC GAGTTGAAAC TGTGAAAAAC CTAAAGGCAG CAGGTATTCA AGCTTGCACA 
GGAGGTATTA TTGGTATGGG TGAAACTTGG GCAGATAGGA TAGATTTGGC CTTGGCCTTG 
CGAGAGTTAG AGGTTGAGTC TGTACCTTTG AATTTGTTAA ATTCTCGCGA AGGTACTCCA 
CTAGGTGGTT TGCTTAAGTT AGATCCTTAT GATGCTTTGA AAGCGATCGC TATTTTTCGT 
CTAATTTTAC CAAAGCAAAT TATTCGCTAT GCTGGAGGGC GAGAAGCTGT AATGGGAGAT 
TTGCAAGCTT TGGGTTTGAA GGCTGGTATT AATGCTATGT TAATTGGCCA TTATCTGACA 
ACTCTTGGTC AACCTCCAGA AAAAGATCAA GCAATGCTAA AATCTCTTGG ACTTCAAGGT 
GGTGAAACTC CTATTGCAAC TAATGGCTTG TAA

Protein sequence

MIAVLKTPLS NHIKANTKAL FSSLPKTKNE LEISLDDLAK QIISGYRLSR EEAIILTQIA 
GEEDILLLCE AADRVRQACC GNVVDLCSII NVKSGGCSEN CSFCSQSVHH PGEDSPIYGL 
KSTEEILDQA KAAEAAGAKR FCLVSQGRGV KYNSPKSTEF EQILGTVRQI LAETNIKPCC 
ALGELTPEQA QALAEAGVTR YNHNLEASEH FYPEIVSTHS WNDRVETVKN LKAAGIQACT 
GGIIGMGETW ADRIDLALAL RELEVESVPL NLLNSREGTP LGGLLKLDPY DALKAIAIFR 
LILPKQIIRY AGGREAVMGD LQALGLKAGI NAMLIGHYLT TLGQPPEKDQ AMLKSLGLQG 
GETPIATNGL